Desktop version

Home arrow Language & Literature

  • Increase font
  • Decrease font


<<   CONTENTS   >>

Capi'tulo 2 La lingufstica de corpus у la metodologfa de la investigacion linguistica

Resumen

La intencion de este capi'tulo es proporcionar una vision general del lugar que ocupa la LC en el conjunto de la lingiifstica actual. Comienza con un intento de clarificar la situa- cion de las ciencias empfricas culturales en el conocimiento cientffico у se pasa luego a las cuestiones metodologicas mas importantes para nuestra disciplina, con especial atencion al caracter de los datos que manejamos habitualmente. En el ultimo apartado se resumen las caracterfsticas diferenciales mas importantes que presenta la LC con respecto a la lingiifstica racionalista por un lado у a la lingiifstica descriptiva tradicional por otro.

Cuestiones metodológicas previas

La organización del conocimiento científico

La intencion de este libro es, сото se senala en la introduccion, facilitar la familiarizacion con las tecnicas у practicas susceptibles de ser empleadas en linguistica de corpus (LC) para el mejor conocimiento de las caracteristicas del espanol, tanto en las variedades que lo cons- tituyen actualmente сото en las correspondientes a epocas anteriores. El caracter practico que se pretende lograr en esta obra no esta renido, sin embargo, con la reflexion necesaria acerca de las cuestiones teoricas que fundamentan los fenomenos lingiiisticos analizados у tambien el proceso mismo mediante el cual tratamos de entenderlos у explicarlos. Por otro lado, la LC ha supuesto, en sus sesenta anos de historia, una importante modificacion en la forma de trabajar en linguistica, desde los procedimientos con que se reunen los datos relevantes para su investigacion hasta el modo en que pretendemos explicar el compor- tamiento de los fenomenos estudiados en el interior de los sistemas lingiiisticos. No sera inutil, por tanto, dedicar unas cuantas paginas a situar, siempre en un nivel introductorio, las cuestiones metodologicas mas importantes para la investigacion linguistica consideradas desde la perspectiva de la LC.

La linguistica es una disciplina cientifica, es decir, es una ciencia. Esta caracterizacion, que muy pocas personas discutirian hoy, choca, sin embargo, con la organizacion administrative у educativa de los saberes habitual entre nosotros. A nivel general, quienes han hecho estudios medios о universitarios en Espana у en algunos otros paises del ambito hispanico se caracterizan diciendo “soy de ciencias” о “soy de letras”. “Soy de letras”, por ejemplo, puede servir para que alguien justifique sus dificultades para calcular un porcentaje, entender la diferencia entre la fision у la fusion nucleares, comprender el funcionamiento general del cerebro, el mecanismo del cambio climatico, el concepto de entropia о los efectos de una determinada sustancia sobre los organismos vivos, por citar unos cuantos de entre los varios miles de aspectos importantes en nuestra vida sobre los que rnucha gente considera que no puede decir ni entender nada porque pertenecen a un mundo intelectual distinto del suyo. En sentido contrario, “soy de ciencias” es utilizado a menudo para justificar la ignorancia sobre temas сото, entre otros muchos, la historia de la humanidad, los grandes movimientos culturales у artfsticos, los grandes escritores, escultores, pintores о arquitectos, la organizacion social, los filosofos у pensadores que han convertido el mundo en lo que es en la actualidad у un largo etcetera. Esta dicotomia ha sido presentada con mucha frecuencia bajo la etiqueta “las dos culturas”, siguiendo la generalizacion del estereotipo planteado por Charles Percy Snow en 1959 (с/. Snow 1964).

Esta diferenciacion, tradicional en Espana у que, por ejemplo, estructuraba directamente la dos ramas del bachillerato superior en el plan de 1957,1 ha ido mutando en apariencia, tanto en la organizacion de los estudios сото en la estructuracion de los campos de inves- tigacion у especialidades. Para citar solo un ejemplo ilustrativo, las especialidades universi- tarias implantadas en Espana сото consecuencia de la aprobacion del llamado “Plan Bolonia” han de ser adscritas a una de las ramas de conocimiento siguientes segun determina el R.D. 1303/2007:2

  • • Artes у Humanidades
  • • Ciencias
  • • Ciencias de la salud
  • • Ciencias sociales у jurfdicas
  • • Ingenieria у Arquitectura

Salta inmediatamente a la vista la incongruencia que supone hablar primero de “ciencias” para luego, al mismo nivel, referirse a “ciencias de la salud” у “ciencias sociales у juridicas”. Pero lo que interesa aqui es, evidentemente, que esa organizacion excluye tanto a “Artes у Humanidades” сото a “Ingenieria у Arquitectura” del conjunto de los conocimientos cienti- ficos. Por otro lado, las Humanidades (equivalentes, grosso modo, a las “Letras” tradicionales) van en el mismo bloque de las “Artes”, de modo que, por ejemplo, los estudios historicos (en todas sus ramas, desde la historia medieval a la arqueologia) forman grupo con la practica de la pintura о la escultura.5

Parece claro que en la clasificacion reproducida hay muy pocos elementos utiles para entender сото se organize у estructura el conocimiento cientifico у en que rasgos podemos basarnos para establecer sus diferencias у semejanzas. El punto de partida tiene que ser dis- tinto. Por su claridad, presentare aqui una organizacion basada en la propuesta, hace ya bastante tiempo, por el fisico, teorico de la ciencia у filosofo argentino Mario Bunge (1969, 38 у sigs.), que permite, en mi opinion, una comprension nitida у rapida de los aspectos fundamentals.

El primer corte que hay que hacer se refiere, сото es logico, a la diferencia entre el cono- cimiento cientifico у el no-cientifico. La astronomia у la quimica son ciencias, mientras que la astrologia у la alquimia, son no-ciencias, carecen de las caracteristicas que exigimos actual- mente a los que consideramos saberes cientificos (basicamente admision de contraste, posibilidad de reiteracion del experimento, argumentacion empiricamente comprobable, capacidad de prediccion, etc.). Sin mengua de su claridad, estos ejemplos, nos sirven tambien para dejar constancia de que la frontera entre ambas formas de conocimiento no han sido constantes о que, dicho de otro modo, los requisitos exigibles a las “ciencias” no han sido siempre los mismos, puesto que, сото es bien sabido, astronomia у astrologia, alquimia у quimica en sentido estricto estuvieron inextricablemente unidas durante muchos siglos.4 Como veremos posteriormente, en el apartado 2.3.1, uno de los inconvenientes de las his- torias de la ciencia tradicionales (y no solo tradicionales) consiste en considerar que existe un momento bien definido en el que un saber precienti'fico se convierte en cienti'fico, lo cual nos permitirfa establecer algo asi сото la fecha de nacimiento de una determinada disciplina.

Ya en los conocimientos cienti'ficos, la primera division es la que existe entre las ciencias formales у las ciencias factuales о empiricas. Las formales son la matematica у la logica, disciplinas que, segiin Bunge (1972a, 8-9), no se ocupan de hechos, sino que “tratan de entes ideales; estos entes, tanto los abstractos сото los interpretados, solo existen en la mente humana”. Las factuales, en cambio, se ocupan de hechos exteriores a ellas mismas (las estre- lias, la caida de los cuerpos, el comportamiento animal, los mecanismos sociales, etc.), de modo que sus enunciados han de ser “verificables en la experiencia, sea indirectamente (en el caso de las hipotesis generales), sea directamente (en el caso de las consecuencias singulares de las hipotesis)” (Bunge 1972a, 15; cursiva en el original). Es decir, las ciencias empiricas se ocupan de hechos externos, requieren datos empiricos у solo “la experiencia puede decir- nos si una hipotesis relativa a un cierto grupo de hechos materiales es adecuada о no” (ibidem).

Finalmente, en las ciencias empiricas es necesario diferenciar entre las naturales у las culturales, que se distinguen por las caracteristicas de sus objetos de estudio. Es decir, la quimica о la biologia у la linguistica о la sociologia tienen la misma configuracion general, los mismos requisites у obligaciones, pero se diferencian por el hecho —decisivo— de que la segunda pareja у las que se relacionan con ellas se ocupan de resultados de la actividad cultural humana. Todas ellas son empiricas, lo cual significa que deben poseer objetividad (es decir, independencia de los datos con respecto a quienes los recojan у estudien y, al menos hasta cierto punto —cf. infra— tambien de las herramientas empleadas para obte- nerlos), replicabilidad (los datos у los experimentos pueden ser analizados у reproducidos por otras personas) у pertinencia de los datos manejados con respecto al fenomeno estu- diado.5 La diferencia entre los dos grupos reside en la naturaleza propia de sus objetos de estudio у supone diferencias importantes en tanto que los atomos, los globulos rojos о las galaxias se comportan de modo distinto а сото lo hacen los hablantes, los grupos sociales о los agentes economicos.

Es precisamente la divergencia entre los objetos naturales у los culturales la que puede explicar el comportamiento distinto de estos dos tipos de ciencias con respecto a factores tan importantes (y relacionados entre si) сото la predictibilidad у las caracteristicas de las leyes formulables en cada caso. La naturaleza de los fenomenos analizados permite entender con claridad la diferencia que existe entre datar un objeto a partir de la tasa de carbono-14 (una vez poseemos la forma de medirla) о la orbita de un cuerpo celeste у el comportamiento de los mercados bursatiles о la evolucion de un determinado sistema fonologico a lo largo de la historia de la lengua. Las ciencias empiricas culturales trabajan muchas veces con objetos individuales о con fenomenos sobre los que incide una enorme cantidad de variables que no siempre son conocidas ni procesables.6 Es importante tambien tener en cuenta que estos rasgos no se presentan en todas las ciencias empiricas naturales del modo en que estamos acostumbrados a encontrarlas en, por ejemplo, la fisica, la quimica о la astronomta. Por citar un caso claro, a pesar de la riqueza у fiabilidad de los datos que se pueden manejar (proce- dentes de satelites, boyas, barcos, estaciones, etc.) у de la potencia у velocidad de las com- putadoras que procesan los datos, no es raro que las predicciones meteorologicas fallen con cierta frecuencia, incluso de forma estrepitosa en ocasiones. La razon de ello es, precisamente, la gran cantidad de variables que hay que manejar у el desconocimiento de una parte de las interacciones existentes entre todos ellos. No parece razonable, por ejemplo, negar a la sismologfa el estatus de ciencia por el hecho de que todavfa no sea posible predecir los terre- motos. De modo semejante, la horquilla temporal que se obtiene de la aplicacion de la tec- nica de medicion del carbono-14 es mucho mas estrecha у segura que la que se maneja al tratar de averiguar, mediante los llamados “relojes moleculares”, el tiempo que hace que se separaron dos especies de seres vivos.7

Mutatis mutandis, algo parecido, habitualmente en un grado mas alto, es lo que sucede en las ciencias culturales al tratar de predecir el comportamiento de un individuo о un grupo social (en procesos electorales, por ejemplo) о la evolucion de los mercados. En calculos temporales del estilo de lo que se hace con el carbono-14 о las diferencias en el ADN es ilustrativo el movimiento denominado glotocronologfa, creado у desarrollado inicialmente por Morris Swadesh [1909-1967] a mediados del siglo pasado. La idea basica consiste en suponer que las lenguas van introduciendo elementos nuevos en todos sus modulos, incluido un grupo de palabras de significado basico у general, insensible a las diferencias culturales y, por tanto, identificable en todas las lenguas. En consecuencia, si analizamos el grado en que dos lenguas distintas contienen elementos comunes о diferen- tes en ese subconjunto lexico basico podremos disponer de una medida de la divergencia entre esas dos lenguas. Y si suponemos que la diferenciacion se desarrolla a un ritmo constante, tendremos una forma de medir el tiempo transcurrido desde que dos lenguas se separaron del tronco comun у comenzaron a evolucionar por vfas independientes. Segtin los calculos iniciales de Swadesh, la tasa de retencion de elementos comunes en dos lenguas diferentes es del 86 % por milenio, esto es, cambia cada mil anos un 14 % de los elementos pertenecientes a ese inventario basico y, por tanto, pierden en esos puntos la relacion con las lenguas emparentadas. Es del todo razonable suponer que dos lenguas que presentan un porcentaje menor de elementos comunes llevan mas tiempo separadas que dos lenguas que comparten un tanto por ciento mayor. Sin embargo, el paso de esa consideracion general a los calculos especfficos esta repleta de dificultades, algunas de ellas insalvables. En primer lugar, el establecimiento del subconjunto de vocabulario que se va a tomar en consideracion. Se han elaborado listas distintas, tanto en el numero de elementos que las componen сото en su caracter concreto. En el paso siguiente, la decision acerca de si dos palabras que tienen significados similares estan foneticamente emparentadas у pueden ser remitidas a un origen comun resulta complicada e insegura en una buena cantidad de casos cuando los perfodos transcurridos desde la separacion pueden estar situados en cinco mil anos о mas. Desde otro punto de vista, las tasas de retencion de elementos comunes estan construidas sobre familias de lenguas en las que esos datos son razonablemente seguros, pero son siempre medias estadfsticas, de modo que es previ- sible la existencia de una fuerte dispersion en los resultados reales. En definitive, la gloto- cronologia muestra los inconvenientes у las dificultades que presentan los intentos de proyeccion de datos cuantitativos conocidos a zonas desconocidas. La razon de esas difi- cultades radica, por supuesto, en la enorme cantidad de variables que actuan en procesos de tipo social у cultural.8

Asi pues, la lingiifstica es una ciencia empfrica cultural y, en consecuencia, debe respetar todas las caracterfsticas del conocimiento cientffico y, al tiempo, reconocer las peculiari- dades que derivan de la naturaleza cultural у social de su objeto de estudio, que son el lenguaje у las lenguas. Esta consideracion, ampliamente aceptada hoy en dfa, es relativa- mente reciente. La lingiifstica ha buscado siempre su reconocimiento сото discipline cientffica, pero lo ha hecho con demasiada frecuencia por caminos equivocados о incon- gruentes con su propia naturaleza. Por ejemplo, a lo largo del siglo xix, persiguio el estatus de ciencia tratando de imitar у aplicar los metodos empleados en las disciplinas que en ese momento estaban en la vanguardia del conocimiento: el comparatismo en la primera parte del siglo у la biologfa evolutiva darwiniana en la segunda mitad. Como es bien sabido, los Junggrammatiker9 consideraban que el dnico conocimiento lingtifstico de interes es el cono- cimiento historico, crefan que las lenguas evolucionan de acuerdo con unas leyes semejantes a las naturales —las llamadas “leyes foneticas”— sin mas excepciones que las debidas a la analogfa y, en casos сото el de August Schleicher [1821-1868], llegaron a considerar que las lenguas son organismos vivos, que nacen, crecen, se reproducen у mueren. Las reacciones contra esta opcion surgieron inmediatamente (la dialectologfa, la geograffa linguistica, etc.) у distintos movimientos у autores se empenaron en tratar de mostrar que, por el contrario, poco о nada en las lenguas presenta esa fijeza у que lo que predomina es, mas bien, la varia- cion, la irregularidad. Evidentemente, el fallo esta en la consideracion de que los cambios lingiifsticos obedecen a leyes que tienen el mismo caracter que las que afectan a la cafda de los cuerpos о las orbitas de los planetas, es decir, no tomar en cuenta la diferente naturaleza que poseen.10

Tener presente que el lenguaje, las lenguas у los actos lingufsticos son objetos culturales nos sitiia, pues, en el camino adecuado: considerar que la linguistica es una disciplina empfrica, sometida, por tanto, a los requisites del conocimiento cientffico, pero sin pcsibili- dad de aspirar a alcanzar las caracterfsticas de fijeza у predictibilidad que poseen las que se ocupan de objetos naturales. El reconocimiento del caracter cultural de la linguistica no puede ocultar, sin embargo, que la comunicacion linguistica у las lenguas funcionan de modo que se apoyan finalmente en un soporte material, sin el cual no es posible la comunicacion (al menos, no mientras no poseamos capacidades telepaticas). Las lenguas у los enunciados lingufsticos tienen una estructura у unas caracterfsticas determinadas, precisamente, por esa servidumbre material, que hace que no podamos emitir dos enunciados, dos palabras о dos sonidos al mismo tiempo. Hay, por tanto, dos caras, distintas entre sf, que pueden dar lugar a disciplinas de caracterfsticas diferentes.

El analisis del componente fonico de las lenguas puede ilustrar la forma en que conviven estas dos caras у сото se interrelacionan у complementan. La fonetica anterior al siglo xx era, con algunos elementos atfpicos, de base articulatoria, сото muestran sistematicamente las descripciones de sonidos (presentados casi siempre сото “letras”) para extranjeros о en textos para personas sordas. Con el desarrollo de la aciistica comenzaron las aplicaciones a los sonidos producidos por los seres humanos con fines comunicativos de las mismas tecnicas utilizadas para el analisis de sonidos de cualquier otro tipo, gracias a aparatos сото el qui- mografo y, mas tarde, el espectrografo, con los que se obtienen imagenes que reflejan obje- tivamente las caracterfsticas del sonido registrado. Sorprendentemente, el avance en el analisis aciistico produjo una situacion paradojica en tanto que esos procedimientos no terminaban en resultados сото, por ejemplo, poder contemplar la imagen aciistica de una “a” о una “t”, puesto que las imagenes del “mismo sonido” realizadas por diferentes personas о incluso por el mismo sujeto daban lugar a quimogramas о espectrogramas diferentes. De esa terrible у angustiosa crisis пасе, precisamente, la fonologfa, que, basandose en ideas elaboradas por de Saussure [1857-1913] у la llamada escuela de Kazan, consigue, en un tiempo sorprendentemente reducido, organizar la perspectiva adecuada: los fonemas son elementos abstractos, son formas que tienen distintas realizaciones foneticas cuyas diferen- cias no son en muchos casos percibidas por los propios hablantes, a pesar de que son capaces de producirlos espontaneamente, сото sucede, por ejemplo, con la distribucion de los sonidos [b] (oclusivo bilabial sonoro) у [p] (aproximante bilabial sonoro) сото alofonos del fonema /Ь/ en espanol que se realizan en la pronunciacion habitual de ambos у sabana, por ejemplo.

Asf pues, fonos (o sonidos) у fonemas son elementos lingiii'sticos que resultan de diferentes perspectivas, ambas necesarias para poder captar en toda su rica complejidad lo que sucede en esta zona de las lenguas. La estructura fonologica de una lengua (su sistema fonologico) es una estructura formal que configura de forma peculiar la materia fonica. Esto permite explicar, por cierto, el hecho de que la misma materia fonica (por ejemplo, [s] у [z]) pueda ser estructurada de dos formas distintas en lenguas сото el espanol у el frances. Estos dos sonidos son realizaciones diferentes del mismo fonema /s/ en espanol actual (casa у rasgo),11 pero realizaciones de dos fonemas diferentes en frances (poisson у poison) у en muchas otras lenguas.

Este caracter, inevitablemente doble, se manifiesta repetidamente tanto en la linguistica сото en muchas otras disciplines culturales, que tienen que combinar el analisis de la parte material con la forma impuesta a la materia en el interior de un grupo humano. En linguistica se observa tambien en la existencia de disciplines сото, por ejemplo, la neurolinguistica о la psicolingiiistica, que actuan сото una especie de puentes entre la orilla desde la que se contempla la actividad linguistica en tanto que fenomeno neurologico о psicologico, у la orilla desde la que se considera su faceta netamente linguistica.

 
<<   CONTENTS   >>

Related topics