Desktop version

Home arrow Language & Literature

  • Increase font
  • Decrease font


<<   CONTENTS   >>

Prologo

Cualquier presentacion general acerca de la evolucion de los estndios lingiifsticos en la segunda mitad del siglo xx situara en un lugar muy destacado la reconfiguracion de objetivos у metodos derivada de la obra de Noam Chomsky. Ese efecto es innegable у puede detectarse en los ambitos mas diversos de nuestra disciplina, incluidos aquellos en los que la influencia de la lingiifstica de orientacion racionalista se materializa mas bien en la reaccion contra su modo de entender la investigacion. Sin que se pueda negar la enorme importancia de la gramatica generativa, hay que reconocer, ademas, la existencia de algunas otras tendencias que han contribuido a disenar el panorama general que presenta la lingiifstica en la segunda decada del siglo xxi. La lista puede ser bastante larga si atendemos a la considerable variedad disciplinar existente, pero creo que hay algunas corrientes que destacan de modo especial por sus repercusiones en ambitos muy distintos. La primera de ellas puede ser el conjunto de las aproximaciones de caracter funcionalista, surgidas en muchos casos сото consecuencia de la necesidad de revisar los presupuestos basicos del estructuralismo tradicional, excesi- vamente dependiente de la fonologfa у poco adecuado para comprender у explicar otros componentes de las lenguas. La sociolingiifstica ha producido un cambio radical en nues- tra forma de considerar las lenguas у el modo en que deben ser estudiadas. La variacion, una faceta innegable pero incomoda, en las concepciones clasicas se ha convertido en un aspecto central, determinante de todo lo demas, de nuestra comprension de la estructura у funcionamiento de las lenguas. Ademas, ha contribuido decisivamente a remodelar los estu- dios de orientacion diacronica, considerablemente beneficiados tambien por la existencia de los corpus. La lingiifstica de corpus (LC) ha sido, en mi opinion, el tercer gran elemento renovador de los estudios lingiifsticos. Surge сото consecuencia de las posibilidades brinda- das por el uso de computadoras en lingiifstica у pasa, en muy pocos anos, de ser un recurso que permite realizar con ventaja tareas сото la identificacion у reunion de datos a conver- tirse en el motor de un cambio metodologico general cuyas consecuencias podemos observar ahora en los mas diversos ambitos de nuestra disciplina.

La lingiifstica hispanica llego con cierto retraso a la LC. A comienzos de los anos noventa, epoca en la que se diseno у completo el British National Corpus, constituido por cien millones de formas у modelo para todos los corpus de referencia posteriores, los corpus de espanol tenfan un tamano mucho menor у se enmarcaban habitualmente en proyectos de investiga- cion de ambito europeo, сото CRATER у PAROLE, о eran construidos сото recurso aux- iliar de proyectos lexicograficos, сото el corpus CUMBRE, el Vox-Biblograf о el Corpus del Espanol Mexicano Contemporaneo, pero es de destacar que algunos otros presentan un caracter innovador, сото sucede con los construidos en torno a las celebraciones del V Centenario. En 1995, la Real Academia Espanola tomo la decision de abandonar su sistema tradicional de recogida de datos у comenzar la construccion del CREA primero у el CORDE pocos meses despues. Las primeras versiones de ambos corpus fueron publicadas en 1998 y, a partir de ese momento, la LC experimento un crecimiento muy notable en el ambito his- panico hasta llegar a la situacion actual. Podemos hoy reunir datos procedentes de corpus constituidos por miles de millones de formas сото el Es-Ten-Ten о el Corpus del Espanol (web/dialectos), trabajar con corpus de referencia сото el CREA о el CORPES, usar corpus diacronicos сото CORDE о CORDIAM, con corpus especializados del estilo de los proyec- tos Biblia Medieval о CHARTA, con corpus orales сото PRESEEA, ESLORA о COSER, corpus de aprendices de espanol L2 сото CAES у un largo etcetera. En definitiva, la linguistica hispanica presenta en este punto un panorama todavia bastante alejado del que tiene el ingles, pero semejante al que se puede observar en muchas otras lenguas.

La influencia de la LC en la linguistica hispanica ha sido intensa, comparable a la que ha tenido en otras lenguas, quiza con un factor de repercusion especial en una tradicion que con cierta frecuencia trabajaba con pocos datos, procedentes casi siempre de los mismos textos. La investigacion sobre el espanol, en todas sus variedades у perspectives, puede practicarse hoy con una solidez у un bagaje empirico que resultaban inimaginables hace tan solo treinta anos. Sin embargo, la importancia de este proceso no ha tenido efectos visibles en la configu- racion general de la LC ni en la presentacion de sus caracterfsticas generales о su historia. Hay que senalar que, en este punto, no se trata unicamente de la marginacion del espanol. En realidad, son todas las lenguas distintas del ingles у todas las tradiciones investigadoras que no son la anglosajona las que estan ocultas, incluso para quienes nos movemos habitual' rnente en otros contextos. No es algo especi'fico de la LC; por citar solo casos muy claros, las historias de la lexicografia no reflejan la importancia (ni la existencia) del Diccionario de autoridades, Andres Bello no aparece en las referidas a la gramatica, las obras de Keniston о Fernandez Ramirez no son conocidas ni mencionadas fuera de nuestro ambito especi'fico . .. En la misma h'nea, fuera de la linguistica hispanica, son muy escasas las referencias a los corpus de espanol у las que aparecen se refieren casi exclusivamente a los construidos en el mundo anglosajon.

Es, sin duda, la proyeccion en la linguistica del fenomeno mas general de la escasa aten- cion que se presta en el mundo cientifico a la investigacion producida en espanol. En el caso de la LC, a estos factores generales se suma otro de caracter especi'fico: no existen introduc- ciones a esta corriente escritas en espanol que utilicen corpus de espanol у muestren сото se pueden tratar e intentar resolver con datos de corpus problemas de linguistica espanola. Ese es, precisamente, el vacio que me he propuesto llenar con este libro. Lo he concebido сото una introduccion general a la LC planteada desde la tradicion hispanica. Por tanto, los ejemplos, las ilustraciones, los problemas у los corpus manejados se refieren al espanol, aunque, сото es logico, sin ocultar los vinculos pertinentes con otras lenguas.

El libro tiene una marcada orientacion didactica. Esta dirigido fundamentalmente a estu- diantes de los tiltimos cursos de grados vinculados a linguistica espanola, estudiantes de master у doctorandos que desean adquirir formacion en este terreno о necesitan profundizar en el. Esta orientacion, producto de una larga experiencia en la imparticion de cursos de maestria у especializacion sobre LC, explica la organizacion general del libro. Su punto de partida (capitulo 1) consiste en una descripcion rapida у superficial de que es un corpus textual у cuales pueden ser las formas у ambitos en los que puede ser utilizado para la inves- tigacion. Los demas capitulos van desarrollando, con la extension у profundidad adecuadas a un texto introductorio, los temas esbozados en el primer capitulo. Esta estructura hace inevitables у tambien aconsejables algunas repeticiones: los mismos aspectos son tratados en cada ocasion a un nivel diferente.

La obra es una introduccion practice a la LC del espanol. Este caracter implica que debe ocuparse de todos los aspectos generates de esta orientacion, pero tambien —quiza incluso, sobre todo— de la forma concreta en que puede acometerse la recogida de datos sobre los fenomenos acerca de los que se pretende realizar la investigacion. En otras palabras, se atiende tanto al planteamiento de los problemas sobre los que se puede trabajar сото a la forma en que hay que manejar las aplicaciones de consulta de diferentes corpus de espanol. En este sentido, los problemas analizados tienen una justificacion intri'nseca, pero su apa- ricion en un punto determinado esta casi siempre determinada por la aplicacion de un pro- cedimiento concreto que permite reunir los datos pertinentes.

Cada capftulo va precedido por un resumen у finaliza con un apartado de lecturas comple- mentarias recomendadas у otro en el que se plantean diferentes cuestiones, problemas у temas de investigacion. Dado el caracter introductorio de la obra, se ha pretendido que las lecturas complementarias sean adecuadas al nivel de conocimientos que se supone en los lectores, aunque no siempre ha sido posible conseguirlo. Por la misma razon, en el ultimo capftulo se proponen tareas relativamente sencillas —о que, al menos, pueden ser tratadas con facilidad— incluidas siempre no por su relevancia teorica, sino para provocar la apli- cacion de las tecnicas de recuperacion у analisis descritas en los apartados precedentes. Dadas las caracterfsticas especiales del capftulo 7, me ha parecido conveniente en este caso incluir bloques de tareas practicas que estan distribuidos a lo largo de todo el texto, con la intencion de ir comprobando la comprension progresiva del funcionamiento de las utilidades analizadas.

El capftulo 1 pretende, сото se ha dicho ya, proporcionar una introduccion general a los corpus, la lingufstica de corpus у los diversos ambitos en los que puede ser aplicada. En el segundo se tratan algunas cuestiones metodologicas generales que considero de gran interes para la investigacion en lingufstica. El tercero retoma las cuestiones generales sobre corpus у lingufstica de corpus descritos superficialmente en el capftulo 1, pero ahora a un nivel considerablemente mas alto, aunque sin alejarse del caracter basico de toda la obra. Consiste en la descripcion de todas las tareas que hay que realizar para construir un corpus у los aspec- tos mas importantes del trabajo con estos recursos. Algunas de las cuestiones tratadas estan mas relacionadas con el diseno у construccion de los corpus que con su explotacion, pero es imprescindible, en mi opinion, que exista una comprension adecuada de todo lo que esta implicado en un corpus para lograr una explotacion adecuada de los datos que pueden obte- nerse mediante su consulta.

Los capftulos 4 у 5 constituyen la aplicacion de las tecnicas habituales en la LC a feno- menos lexicos у gramaticales, respectivamente. Como he indicado ya, las cuestiones tratadas han sido seleccionadas no por su interes propio, sino sobre todo сото ejemplos reales con los que se puede aprender a recuperar у tratar datos de los corpus textuales. Cuando es nece- sario se hace una breve descripcion del problema que se va a tratar, para que todos los lectores de la obra tengan el conocimiento necesario у puedan entender adecuadamente la naturaleza de lo que se trata en cada caso. He pretendido poner ejemplos correspondientes a diferentes enfoques: sincronico, diatopico, diacronico, diastratico у atender tambien a otras posibles utilizaciones de los corpus, сото el estudio de la lengua hablada, del espanol de los aprendi- ces de esta lengua сото L2 о el espanol rural.

En el capftulo 6 se desarrollan algunas cuestiones generales a las que se alude en los capf- tulos anteriores, pero sin la extension que merecen para poder ser entendidas en todas sus dimensiones. Son, en cierto modo, grandes temas de la LC a los que aquf se dedica atencion, aunque se tratan al nivel basico que corresponde a una obra de este tipo. Finalmente, en el capitulo 7 se exponen algunas posibilidades avanzadas de unas cuantas aplicaciones de con- sulta у tambien una serie de herramientas informaticas de utilidad para quienes necesiten obtener la informacion contenida en textos que no estan integrados en corpus у que, en consecuencia, no disponen de las aplicaciones de consulta a las que estamos acostumbrados. Estas Ultimas son herramientas propias de algunos sistemas operativos que pueden facilitar considerablemente el trabajo con los textos, las listas de ejemplos, listas de frecuencias y, en general, tanto con los textos сото con los resultados de su analisis. Su desarrollo se hace a un nivel elemental у sin requerir conocimientos especiales de programacion, pero puede ser manejado tambien сото una introduccion muy elemental a la llamada ciencia de los datos (data science) aplicada a la linguistica. La obra se cierra con un breve glosario que puede servir para la consulta rapida del significado de algunos conceptos fundamentales en LC, un l'ndice tematico у las referencias bibliograficas de los recursos у obras citadas en el texto.

Los aspectos cuantitativos son un elemento fundamental en la LC y, en ese sentido, son frecuentes las alusiones a que los grados en linguistica deberian incluir cursos de estadistica, lo mismo que se ha hecho desde hace ya tiempo, en algunas otras especialidades adscribibles a las llamadas Humanidades. Aunque estoy de acuerdo con esa idea, he decidido no pasar en el libro de algunos conceptos muy basicos. El deficit de formacion matematica у estadistica en la generalidad de los estudiantes de linguistica no se puede resolver con un capitulo en una obra introductoria, sino que requiere un planteamiento distinto, dificilmente compatible con la orientacion у tamano de este libro.

En la parte mas practica de la obra, he tratado de poner ejemplos de trabajo con una amplia gama de corpus, pero no he pretendido incluirlos todos. He buscado siempre los de caracter mas general, los mas facilmente accesibles у los que resultan mas adecuados para la tecnica que se pretende ilustrar en cada caso о el problema que se desea resolver. De forma inevitable, he utilizado sobre todo los que conozco mejor, aunque primando siempre la adecua- cion a los propositos generales del libro.

El capitulo de agradecimientos es casi tan largo сото el tiempo que he necesitado para terminar este libro. El primer lugar lo ocupan, sin duda, los numerosos estudiantes con los que he tenido oportunidad de trabajar sobre temas relacionados con la LC en muy diversas universidades. Como me ha ocurrido en muchas otras ocasiones, ha sido el esfuerzo necesario para explicar a otras personas los muy diversos temas tratados aqui lo que me ha permitido comprenderlos con la profundidad necesaria. El nutrido grupo de colegas que me ha acorn- panado en la USC a lo largo de mi carrera profesional ha sido un factor decisivo en mi interes por la LC, que arranco cuando, hace ya muchos anos, decidimos construir la Base de Datos Sintacticos del Espanol (BDS), que sigue siendo tan util ahora сото lo fue en el momento en que la hicimos publica. El agradecimiento que siento hacia todos ellos tiene una intensi- dad muy especial en el caso de Victoria Vazquez Rozas, de quien he aprendido continuamente desde sus tiempos de estudiante у con quien tengo la fortuna de seguir colaborando en ESLORA у otros proyectos de investigacion. A1 otro lado de una frontera borrosa debo citar a las personas que me han acompanado en el largo proceso de diseno у construccion del Corpus do Galego Actual (CORGA): Marisol Lopez, Eva Dominguez у Mario Barcala, у tambien a Ignacio Palacios, con quien he podido poner a punto el Corpus de Aprendices de Espanol сото L2 (CAES). Una buena parte de lo que hay en este libro es consecuencia directa de la decision que tomo la Real Academia Espanola en 1995, cuando decidio acometer la confeccion del Corpus de Referenda del Espanol Actual (CREA). Sus responsables en aquel momento (Fernando Lazaro Carreter, Angel Martin Municio у Victor Garcia de la Concha) creyeron en las posibilidades у la importancia de un proyecto que se situaba muy lejos de la actividad realizada por la RAE hasta ese momento, lo hicieron posible у marcaron el rumbo que han seguido quienes los han sucedido. En el CREA у todos los corpus academi- cos que han venido despues han colaborado cientos de personas, tanto en la RAE сото en equipos situados en universidades de todo el mundo у algunas otras academias de Asociacion de Academias de la Lengua Espanola. Mercedes Sanchez ha sido una ayuda constante у leal en el trabajo que hemos realizado durante estos veinticinco anos. Finalmente, debo expresar mi reconocimiento a la editorial Routledge, que ha acogido la publicacion de esta obra con un interes que todavi'a no ha dejado de sorprenderme. Los revisores anonimos del original, que me han transmitido valiosfsimas sugerencias, Samantha Vale Noya у Rosie McEwan, editoras de la obra, у Carol Klee, responsable de la coleccion, han hecho sencillos, motiva- dores у agradables los tramos finales de un proceso que nunca se habrfa materializado sin el entusiasmo, el celo profesional у la generosidad de Javier Munoz-Basols.

Framan, agosto de 2020.

Capi'tulo 1

 
<<   CONTENTS   >>

Related topics