Desktop version

Home arrow Language & Literature

  • Increase font
  • Decrease font


<<   CONTENTS   >>

La LC frente a otras aproximaciones

Por razones perfectamente comprensibles a partir de la historia de la LC у la configuracion general de la investigacion lingiifstica en el ultimo cuarto del siglo xx, la mayor parte de las comparaciones у contrastes de la LC con otras aproximaciones se hacen con relacion a la lingiifstica de inspiracion chomskyana. Sin embargo, en los apartados anteriores se ha indicado la conveniencia de oponerla tambien a la lingiifstica descriptiva tradicional. En una vision rapida у forzosamente superficial, la LC у la lingiifstica de orientacion racionalista se diferencian por el tipo de datos utilizados у la tecnica de analisis empleada (introspec- cion frente a datos externos). La LC у la lingiifstica descriptiva tradicional se distinguen, en cambio, por el volumen de datos manejados, su modo de seleccion у el afan de analizarlos de forma exhaustiva.

Como hemos visto, la marginacion sufrida por la LC en los Estados Unidos durante los primeros anos de su historia (cf. infra, 6.1) derivaba de la predileccion de la lingiifstica racionalista por los datos internos, intuitivos, el rechazo a la misma idea de corpus у el desprecio al papel de la frecuencia en los analisis gramaticales. De modo totalmente incorrecto, los generativistas asimilaban el concepto de corpus que se estaba desarrollando entonces al utilizado previamente por los distribucionalistas. Por otro lado, tambien negaban la impor- tancia de los factores relacionados con el papel de la frecuencia en el analisis de los fenomenos gramaticales.26 Leech (2002) proporciona unos cuantos argumentos para mostrar lo injustificado de la oposicion existente en los primeros anos de lingiifstica generativo- transformacional al trabajo con corpus. En primer lugar, la oposicion entre un analisis basado exclusivamente en la introspeccion у un analisis que prescinda por completo de la introspeccion supone la anulacion de las numerosas opciones intermedias. En su opinion, en la LC se acepta que los corpus no pueden ser interpretados

without the intuition and interpretative skill of the analyst, using knowledge of the language (qua native speaker or proficient non-native speaker) and knowledge about the language (qua linguist). In other words, corpus use is seen as a question of corpus plus intuition, rather than of corpus versus intuition.

(Leech 2002, 4)

Por otro lado, la idea chomskyana de la competencia choca frontalmente con la evidente complejidad que presenta relacionada con factores diacronicos, diatopicos, diastraticos о diafasicos. Existen disciplinas lingiifsticas, сото la linguistica historica, la sociolinguistica, la psicolingiiistica, el analisis del discurso y, en general, la linguistica aplicada, en las que los datos necesarios proceden de la actuacion, de los actos lingiiisticos, no de la competencia.

Una buena parte de esas incomprensiones han sido corregidas о reformuladas. A1 tiempo, tambien la LC ha cambiado en aspectos importantes desde el momento en que se formulaban criticas de este tipo, de modo que algunos de los factores de contraste han desaparecido ya o, cuando rnenos, han pasado a tener un papel secundario. Permanece, en cambio, la oposicion entre empirismo у racionalismo. En palabras de Adolphs (2006, 6):

Put simply, rationalist approaches to language are concerned with the way in which the mind processes language, while empiricist approaches are based on the observation of naturally occurring data. As far as linguistic judgements are concerned, rationalism is associated with introspection, e.g. a native speaker making judgements about the meaning of a particular word based on intuition, while empiricism is associated with observing language in use, e.g. through a corpus of recorded discourse events.

Asi pues, la LC trabaja con datos no-introspectivos, no-intuitivos, procedentes de actos comunicativos efectivamente realizados у producidos en condiciones naturales, no someth dos a circunstancias especiales ni creados para un experimento у que pueden sufrir la influencia de la artificialidad provocada para realizarlo. Esta linea no excluye, por supuesto, la aplicacion del conocimiento del linguista, su intuicion сото hablante experto alia donde sea utilizable.27

Aunque apenas se ha prestado atencion a esta otra faceta, resulta mucho mas interesante para nuestro proposito el contraste entre la LC у la linguistica descriptiva tradicional. La razon basica radica en el hecho de que la LC es presentada frecuentemente сото la heredera de la tradicional, la version remozada que es caracteristica del ultimo cuarto del siglo xx у el primero del siglo xxi. Sin duda esa afirmacion es correcta en lo mas general, lo referente al enfoque empirico, pero, сото vamos a ver a continuacion, existen importantes diferencias entre ambas aproximaciones.

Retomando la distincion de Aarts (2000, 2002), los datos no intuitivos, producidos espon- taneamente, en condiciones naturales, pueden ser fragmentarios о bien proceder de corpus textuales construidos precisamente con el proposito de facilitar la investigacion. La diferen- cia no esta, pues, en el tipo de datos —que es lo que opone la LC a la linguistica chomskyana— sino en el modo de reunirlos у analizarlos. Por razones perfectamente comprensibles, derivadas de las condiciones en que se realizaba la recogida de materiales hasta la difusion de las computadoras, la forma tradicional de reunir los datos se hacia mediante el fichado de aquellos ejemplos que, en funcion de los conocimientos de las personas que la desarrollaban у los objetivos supuestos de la futura investigacion, resultaban relevantes. Los problemas derivados de este modo de actuar son diversos, у el analisis de las practicas habituales en la lexicograffa tradicional nos permiten conocerlos у valorarlos con cierta profundidad. Hay que aludir en primer lugar al problema de la propia seleccion de los textos: dado el proposito habitualmente prescriptivo con que se confecciona buena parte de los diccionarios, los textos son elegidos con criterios que estan determinados casi exclusivamente por la importancia que en la epoca en que se hace la recogida se atribuye a los autores de obras de ficcion, su pertenencia al canon que funciona en ese momento, su peso social, etc.28 En muchos casos, sin embargo, las restricciones iniciales van desapareciendo en el curso del trabajo, para dar entrada a textos de otros tipos.29

Con independencia de cual sea el caracter del texto, el inconveniente fundamental de este procedimiento se puede resumir en la indicacion de que implican una seleccion que inevitablemente favorece lo extrano, lo diferencial, lo que llama la atencion de quien despoja el texto, lo que se considera documentacion inicial, etc. у produce la sobrerrepresentacion de elementos de ese tipo. Un ejemplo altamente ilustrativo de esta distorsion, situada en el misrno centra de la mejor tradicion lexicografica, se encuentra en las comunicaciones que James Murray [1837-1915], el primer editor del Oxford English Dictionary (OED), tuvo que dirigir a las personas que colaboraban en la obra haciendo fichas de las obras que se les encar- gaban (los readers) insistiendo en la necesidad de que no se limitasen a enviar ejemplos de palabras raras о significados poco frecuentes:30

Make as many quotations as convenient to you for ordinary words, when these are used significantly, and help by the context to explain their own meaning, or show their use.

(Murray 1879a)

Y en las Additional Notes a esas instrucciones vuelve sobre ello:

If Readers will kindly remember that the Dictionary is to contain all English words ordinary' and extraordinary, that it is to give, if possible, one quotation in each century for every sense or construction of every word, and that it is these quotations that we ask them to supply by their reading, they will at once see why we ask them to give us, not only all the extraordinary words or constructions in their books, but also as many good, apt, pithy quotations for ordinary words as their time and patience permit. The quotations for common words must come from some books; they ought to come from all books; and this can be realised only by each Reader sending some.

(Murray 1879a)

La insistencia en este punto esta perfectamente justificada por la situacion a la que habla tenido que enfrentarse Murray al hacerse cargo del proyecto, que llevaba ya unos cuantos anos en marcha sin indicaciones claras acerca de la recoleccion de materiales:

In my own opinion, the Bases of Comparison formerly issued by the Society were a mistake, and detrimental to the work which they were designed to serve. Their most obvious result, to one who examines the material, is, that while rare, curious, and odd words, are well represented, ordinary words are often most meagrely present; and the editor or his assistants have to search for precious hours for examples of common words, which readers passed by because they happened to find them put down in their ‘Basis’, as occurring in the Bible or in Burke. Thus of Abusion, we found in the slips about 50 instances: of Abuse not five, and we had to spend much time in tracing out the early occurrence of this word which readers had omitted to record. This is why we have asked every reader to give as many common words as he conveniently can: 1 had almost asked that rare and odd words should be omitted,-as apparently we have them all- and only common words noted henceforth.

(Murray 1879b, 571-572; cursivas en el original)

Las cincuenta citas textuales de abusion, una forma extrana у rara, frente a las escasfsimas cinco de la habitual abuse dan una idea clara de lo que suele suceder en estos procesos de seleccion de ejemplos сото consecuencia de nuestra habitual falta de atencion a los feno- menos mas comunes. Los materiales relacionados con la confeccion de sus diccionarios que la Real Academia Espanola ha conservado a traves de los siglos permiten comparar lo recogido mediante los procedimientos tradicionales con lo que se puede encontrar en los documentos incluidos en un corpus. La palabra abusion, que figura en el DLE con cuatro acepciones, todas ellas con la marca de desusadas, no se documenta en el CREA ni en el CORPES у en el CORDE aparecen 216 casos en noventa у seis documentos.31 La compara- cion directa con los registros de la forma general abuso en el Fichero General de la Real Academia Espanola (FRAE) у el CDH se presenta en la tabla 2.4 que sigue:

Tabla 2.4 Casos de abusidn у abus о en el FRAE у el CDH

Fichas en FRAE

Casos en CDH

abusidn

222

252

abuso

359

8682

Fuente: RAE (FRAE у CDH). Elaboraci6n propia

La relacion no es tan desproporcionada сото la que se encontro Murray al comienzo de su etapa al frente del OED, pero la comparacion entre el niimero de fichas у el niimero de ejemplos de estas dos palabras refleja con toda claridad el fenomeno que estamos analizando. Notese, sin embargo, que para valorarlo en todas sus dimensiones hay que tener en cuenta que un porcentaje importante de las fichas del FRAE son fichas lexicograficas, esto es, fichas que reflejan el contenido de diccionarios, vocabularios, lexicos especializados, etc. Y en esta linea es practica comun la introduccion de vocablos que han sido incluidos en obras ante- riores y, por tanto, obedecen a un principio de actuacion diferente.

Algo parecido podemos encontrar si comparamos las cifras correspondientes a diversas variantes vinculadas al verbo nublar, сото se muestra en la tabla 2.5.

Es facil hacerse una idea de las posibles consecuencias negatives de estos desajustes cuantitativos sobre el trabajo posterior (por ejemplo, la redaccion de las entradas corres- pondientes), pero tambien lo es la enorme dificultad (imposibilidad, incluso) de actuar de modo distinto en un mundo en el que el despojo de los textos se hace de forma manual y, por tanto, inevitablemente selectiva. No obstante, el reconocimiento de estas circuns- tancias no puede ocultar los riesgos que suponen. Un ejemplo ilustrativo es el constituido por los procesos asociados a la entrada biombo en el DAut. En un trabajo de Alvarez

Tabla 2.5 Casos de variantes de nublar en el FRAE у el CDH

Fichas en FFiAE

Casos en CDH

anublar

278

392

anublar

260

8

nublar

34

108

nublar

109

3409

Fuente: RAE (FRAE у CDH). Elaboracidn propia

de Miranda (2004) sobre la utilizacion de textos de Quevedo en obras lexicograficas se indica que en el DAut se define biombo сото “alhaja que nos vino modernamente de la China, 6 Japon, у con ella el nombre” e incluye сото autoridad un texto de Antonio de Solis, la Historia de Nueva Espana (Historia de la conquista de Mexico), de 1684, a pesar de que la palabra se documenta con bastante anterioridad en textos de Quevedo. He podido comprobar que el ejemplo de Solis es el unico correspondiente a esta palabra en el fichero usado por los redactores del DAut y, por tanto, el unico que se podia manejar en el momento de redactar la entrada.32 Sin embargo, si se apoya en un texto de Quevedo la entrada biombo del diccionario comenzado por Ayala Manrique (1729). Aludiendo a la nariz de una dama, escribe Quevedo:

Si no sois rayos del sol ni el oriental embeleco sois biombo de los rostros de la frente, balsopetos.

Los academicos redactores del DAut no pudieron manejar el manuscrito de Ayala Manrique, pero lo realmente curioso es que balsopeto (“Bolsa grande para recoger у traer guardadas у escondidas algunas cosas consigo ...”) esta en el DAut у uno de los textos que se aportan esta constituido, precisamente, por los dos ultimos versos de Quevedo que acabo de citar. Es decir, en el proceso de papeletizacion, redaccion, etc., alguien considero que, en el mismo texto, habia que hacer una papeleta de balsopeto, pero no de biombo, con lo que el DAut perdio una posible primera documentacion que estaba clara en los textos que manejaban los academi- cos. Este es el mayor inconveniente de la recoleccion tradicional de ejemplos: se aplica un filtro que depende estrechamente de los intereses у conocimientos de la persona que haga la recogida de materiales, con lo que quedan fuertemente condicionados los datos que pueden manejar quienes accedan luego a esos materiales para redactar las entradas correspondientes.

Pero hay mas. El Corpus Diacronico del Espanol (CORDE) у el Corpus del Diccionario Historico (CDH) contienen dos apariciones mas de la palabra en Quevedo у otra de Castillo Solorzano, en un texto probablemente anterior a los de Quevedo:

Aqui miraua del Cielo los estrellados Biombos a donde tantas figuras han fingido los Astrologos ** 1625 Castillo Solorzano, Alonso de. Donaires del Parnaso. Segunda parte ESPANA 21.individual CORDE, Real Academia Espanola (Madrid), 1998.

Resulta que Donaires del Parnaso figura entre los textos de los que los academicos fundadores extrajeron ejemplos,33 pero tampoco en este caso consideraron importante tomar nota de esta palabra. Son, pues, tres oportunidades perdidas de lograr, con los medios de la epoca, nna documentacion mas antigua para esta palabra.54

Aunque no se aprecia con tanta claridad, estos inconvenientes se producen tambien —у quiza con mayores repercusiones— en los estudios gramaticales. Como senalo Quirk ya en 1960 en la justificacion de la necesidad de lo que serfa posteriormente el SEU, incluso las mejores gramaticas —сото las de Kruisinga о Jespersen— utilizan ejemplos construidos (concocted), lo cual implica que describen

Primarily what is grammatologically received and what he expects to find. From such basic illustrations, the grammarian then radiates out to deal with what he takes to be minor or variant constructions, either again via concocted examples, or sporadically via actual recorded instances, which again have only the status of illustrations.

(Quirk 1960, 72-73)

La superacion de estas deficiencies se logra mediante la posibilidad de analizar los casos contenidos en un corpus de grandes dimensiones, con lo que desaparecen los problemas derivados del escaso volumen de ejemplos disponibles у tambien el efecto perverso de la sobrerrepresentacion de los casos mas llamativos. Pero no se puede ocultar la importancia que tiene el cambio de actitud acerca de la finalidad del analisis. En el primero de los prim cipios en los que basaba su propuesta de elaboracion del SEU, Quirk senalo con toda claridad un camino distinto al que se seguia habitualmente en aquel momento:

The primary material will be all the grammatical data in selected continuous stretches of actual recorded (spoken and written) English. As already noted, for previous grammars (and for some modern structural studies), examples have often been assembled eclectically, a slip being made out by the grammarian when he came across an expression which happened to illustrate a required point or even which simply struck him as unusual. The Survey aims at viewing each grammatical feature, be it commonplace or rare, in the light of a statistical norm and at explaining the circumstances under which users of the language depart from that norm.

(Quirk 1960, 80)

Este cambio de enfoque aparece con toda naturalidad cuando se trabaja con corpus tex- tuales, pero, сото indica tambien Quirk, el cambio profundo no se produce simplemente con el empleo de corpus, sino que procede del cambio de los objetivos. No se trata, pues, del simple cambio de los ejemplos inventados о procedentes de los “buenos autores” selecciona- dos previamente, sino del vuelco metodologico que supone tratar de explicar todo lo que encuentra en los textos. Es posible que gramaticos у lexicografos usen un corpus

[a]s a convenient source for “good examples” to put in their grammar. But that is not where the value or the challenge of a corpus will lie. If we ignore the value and evade the challenge of total accountability, our use of a corpus will be no advance on Jespers- en’s use of his voluminous collections of slips or Murray’s use of those file boxes bursting with marked-up quotations for the OED. Such scholars certainly ensured that everything in their published volumes was firmly anchored in textual reality, but not that everything in their samples of textual reality was reflected in those published volumes.

(Quirk 1992, 467)35

Uso de corpus textuales у analisis exhaustivo van, pues, de la mano. Quirk (1992, 459) pretendfa trabajar con un corpus de ingles contemporaneo que:

  • (a) would be representative of the spoken and written grammatical repertoire mastered by mature native speakers in their varied roles at work or play; and
  • (b) would be subjected to exhaustive and non-selective study: the vital principle of total accountability.

Por otro lado, la posibilidad de trabajar con fragmentos amplios permite acercarse al obje- tivo de la lingihstica basada en Firth (cf. supra, 1.4) para asi poder descubrir “the extent to which ‘words are mutually expectant and mutually prehended’” (Quirk 1992, 459). El principio de la total accountability (exhaustividad, explicabilidad total) se convierte en el rasgo defmitorio у caracteristico del trabajo en LC (cf. Leech 1992, 2011; infra 6.1.1.). Este principio consiste en la consideracion de que los analisis deben ser exhaustivos en dos sen- tidos diferentes. Por un lado, es necesario enfrentarse con todos los casos del elemento о fenomeno que se va a estudiar presentes en el corpus, con lo que se evita el problema de la seleccion sesgada (cf. tambien McEnery у Hardie 2012, 15). Por otro, hay que esforzarse en tomar en consideracion todos los factores contextuales que pueden tener influencia en su comportamiento. En este sentido, el principio de la total accountability utilizado en LC se relaciona estrechamente con el principle of accountability propuesto por Labov (1972a, 108) para el analisis sociolingufstico, que tiene un planteamiento у unos efectos similares.36

Es evidente que el principio de exhaustividad tropieza con las frecuencias que poseen algunos elementos, fenomenos о esquemas en los corpus actuales. No es realista plantearse, por ejemplo, la redaccion de un diccionario que suponga la revision de todas у cada una de las apariciones de un verbo сото llegar en un corpus de referencia: en la version 0.91 del CORPES hay mas de trescientos mil casos de este verbo. La via mas utilizada para sortear este obstaculo es la de trabajar con una seleccion de casos extraidos aleatoriamente a la que se le puede dar el tamano que resulte razonable para la redaccion de una entrada de diccio- nario. Evidentemente, asf no se trabaja con todos los datos, pero la seleccion ha sido realizada sin que hayan influido en ella factores distintos del azar.37 Bastante mas adecuado es utilizar recursos computacionales para analizar los miles о cientos de miles de casos de una palabra tratando de detectar у cuantificar automaticamente los esquemas de uso que la caracterizan. Por esta via, que requiere unos procedimientos especializados, se puede alcanzar la seguridad relativa de que son identificados los factores pertinentes, сото se muestra, a un nivel elemental, en las coapariciones de saco analizadas en el apartado 1.2.6.

 
<<   CONTENTS   >>

Related topics