Desktop version

Home arrow Language & Literature

  • Increase font
  • Decrease font


<<   CONTENTS   >>

La lingüística de corpus

Todo lo considerado hasta ahora deja ver con claridad la dependencia que la LC tiene con respecto al desarrollo de las computadoras у las ciencias de la computacion. En efecto, la LC, que ha remodelado у reconfigurado la forma de trabajar en lingiustica, se ha desarro- llado tanto у de forma tan rapida gracias a la impresionante evolucion de las computadoras, el aumento en su capacidad de calculo у los avances en las tecnicas de programacion. No debemos olvidar, sin embargo, la cara mas “lingiustica” de este proceso. Como veremos con detalle en el apartado 6.1, el primer corpus concebido para ser introducido en una com- putadora, el Brown Corpus, fue finalizado en Estados Unidos en 1964 у no tuvo una buena acogida en la investigacion lingiustica de vanguardia, constituida entonces por la gramatica generativo-transformacional, que comenzaba a extenderse en esos anos. Los partidarios de esta tendencia, con Noam Chomsky сото referente principal tambien en este punto, aso- ciaban los corpus textuales en formato electronico con el concepto de corpus manejado por los distribucionalistas, de lo que se derivaba su consideracion сото un recurso inutil, vincu- lado a una concepcion obsoleta de los objetivos de la investigacion lingiustica. Por esos mis- mos anos, en Europa —mas concretamente en el Reino Unido— se consolidaba la corriente estructuralista surgida en torno a la figura de J. R. Firth [1890-1960]. Firth consideraba que “features such as collocation, colligation, and phraseology had a central (rather than marginal) function in the language system and that the meaning of a word could not be fully understood without knowing ‘the company it keeps’” (Rundell 2018, 3). En ese contexto teorico, Randolph Quirk concibio у emprendio en 1959 la confeccion del Survey of English Usage (SEU), consistente en la reunion de textos escritos у orales de ingles britanico for- mado por doscientas muestras de unas cinco mil palabras cada una. El trasfondo teorico de este proyecto consiste en considerar que solo el analisis de las producciones linguisticas efec- tivamente realizadas puede proporcionar los materiales necesarios para la investigacion. No entraban en la planificacion de Quirk los procedimientos computacionales, pero es evidente su proximidad a ellos. De hecho, Quirk participo сото asesor en la configuracion del Brown Corpus, formado por quinientas muestras de unas dos mil palabras cada una.

Los corpus electronicos surgen, pues, en un ambiente hostil, lo cual explica su escaso desarrollo en los Estados Unidos durante los primeros anos. En cambio, en el Reino Unido у algunos otros pafses europeos, especialmente nordicos, los corpus son recibidos сото el recurso que podia facilitar considerablemente la investigacion de los aspectos relevantes para la compren- sion de los fenomenos linguisticos (cf. infra, 6.1.1). La LC, por tanto, puede ser considerada desde sus orfgenes сото una via claramente diferenciada de la linea racionalista caracterfstica de la orientacion chomskyana у tambien сото una reaccion frente a los procedimientos у materiales de trabajo utilizados en la lingiHstica descriptiva tradicional (cf. infra, 2.3.3). Por su caracter empfrico у tambien por basarse en el analisis de datos procedentes de actos lingufsticos efectivamente realizados, la LC se opone fundamentalmente a la lingih'stica racionalista, mas enfocada hacia la competencia linguistica у caracterizada por utilizar la introspeccion сото fuente basica de los datos. Por supuesto, no se trata de prescindir por completo de la introspec- cion, de gran utilidad cuando quien hace el analisis tiene la competencia requerida. Sin embargo, las intuiciones de los hablantes у tambien de los hablantes-lingiiistas suelen ser par- ciales, mostrar solo una parte del comportamiento у uso de los elementos, у hacer valoraciones acerca de la gramaticalidad de las secuencias mediatizadas por la variedad propia о los prejuicios derivados del enfoque prescriptivista. Ademas, no se puede utilizar para trabajar sobre varie- dades distintas de la propia, puesto que no se dispone del conocimiento exigible. Por otro lado, la LC se opone a la linguistica descriptiva tradicional en tanto que aspira al analisis exhaustivo de todos los casos pertinentes para el fenomeno en cuestion. La linguistica tradicional orga- nizaba las descripciones habitualmente sobre un conjunto de casos seleccionados con criterios cambiantes, en buena parte por la imposibilidad material de trabajar con grandes volumenes de datos. En la LC se aspira a lo que Quirk (1992) ha llamado total accountability (cf. infra 2.3.3), es decir, la aspiracion a examinar “all the linguistic features of a text as well as the way these features interrelate in context” (Aarts 1999, 5; cursiva en el original).

Por otra parte, el componente estructuralista procedente de las concepciones de Firth, incorporadas a la LC a traves de las contribuciones de John Sinclair [1933-2007], Michael Halliday [1925-2018] о Geoffrey Leech [1936-2014], entre otros, ha supuesto un importante sesgo con respecto a los enfoques mas tradicionales en varios terrenos, tanto del lexico сото de la gramatica. Siguiendo la presentacion de Hunston (2002, 3 у sigs.) al referirse a sus repercusiones en la lingih'stica aplicada, el primero de ellos es, sin duda, el que contiene todo lo relacionado con las frecuencias: los corpus textuales son, сото hemos visto en apartados precedentes, el recurso mediante el cual se pone de manifiesto la configuracion estadistica de los textos y, por tanto, la mejor forma de analizar las frecuencias, la dispersion у sus repercusiones en todos los campos. En segundo lugar, los corpus permiten enfocar del modo mas adecuado todo lo vinculado a la fraseologia (cf. supra 1.2.6). Finalmente, constituyen el recurso mas comodo у apropiado para el analisis de las coapariciones, сото hemos visto en ese mismo apartado (cf. tambien Hunston 2002; Hoffman 2008; Flowerdew 2012).

Por ultimo, hay que anadir que la codificacion incorporada habitualmente a los textos que integran los corpus (cf. infra 3.4) permiten la creacion de corpus virtuales у la recuperacion selective de los casos correspondientes a un determinado pals, tipo de texto, epoca, etc. Es posible, por tanto, comparer de forma comoda у segura las frecuencias que un determinado elemento о fenomeno presenta en distintos subcorpus у tratar de saber en que medida influye la pertenencia a distintas variedades diacronicas, diatopicas о diastraticas.

 
<<   CONTENTS   >>

Related topics