Desktop version

Home arrow Language & Literature

  • Increase font
  • Decrease font


<<   CONTENTS   >>

Cuestiones legales y éticas

Resulta conveniente terminar este repaso de los aspectos generales vinculados al diseno, construccion у explotacion de corpus con un apartado dedicado a algunas cuestiones legales у eticas que surgen a lo largo de todo este proceso. Las cuestiones legales se plantean con el almacenamiento у distribucion de los textos que componen el corpus у son, en definitiva, la version actual de los problemas que se han vinculado con la reproduccion de los textos desde, por lo menos, la invencion у generalizacion de la imprenta. Los tan abundantes casos de impresiones no autorizadas por los autores de los textos о los propietarios de los derechos correspondientes se manifiestan ahora con especial gravedad, lo mismo que sucede en muchos otros terrenos, сото la musica о el cine, por la actuacion de dos factores distiiv tos. El primero de ellos es la facilidad que los procedimientos electronicos otorgan a la copia, almacenamiento у distribucion de materiales de los mas diversos tipos. Copiar un texto de forma manual, componerlo e imprimirlo, fotocopiarlo о simplemente pasarlo por un escaner у procesarlo con un programa de reconocimiento optico de caracteres son estadios distintos, progresivamente mas sencillos у mas baratos, de reproduccion de textos que pueden facilitar la vulneracion de los derechos de quienes poseen la propiedad de los textos о de su distribution. En segundo lugar, la existencia de la web permite la generalizacion de las posibilidades de distribucion, sea de forma gratuita о mediante pago de ciertas cantidades, habitualmente pequenas.

En el mundo de los corpus textuales, los conflictos potenciales se plantean sobre todo con la distribucion de los textos, no con su almacenamiento ni con su explotacion para investiga- cion. Salvo que se encuentre en el dominio publico,86 para poder distribuir legalmente un texto es siempre necesario contar con el permiso de los propietarios de los derechos, pero la legislacion cambia entre los diferentes pafses у, сото es de esperar en un contexto que evo- luciona con tanta rapidez, ha ido modificandose en el paso de los anos. Por ejemplo, debido a ciertas peculiaridades de la legislacion inglesa de la epoca, los textos que componen el BNC nunca contienen mas de cuarenta mil palabras. En caso de que el texto original tenga una extension mayor, se corta hasta alcanzar la longitud requerida. Si su extension es menor de esa cifra, se reduce en un 10 %, de modo que en los cien millones de formas que componen el BNC no aparece ningun texto completo.87

Todo esto se refiere a las condiciones en las que se trata de reunir los textos que van a forrnar parte del corpus para luego distribuirlos con una carga mayor о menor de codificacion adicional, anotaciones lexicas у gramaticales, etc. La posibilidad de acceder libremente a los textos en la web no altera el requisite de contar con los permisos correspondientes. Una situacion bastante distinta es la que se plantea cuando se trata de almacenar textos en formato electronico en un sistema informatico propio, sin permitir el acceso desde el exterior о bien, сото sucede habitualmente con los corpus de referencia, cuando los textos residen en un sistema propio у lo que se facilita a quienes hacen las consultas desde el exterior se reduce a una serie, mas о menos, amplia de las que llamamos concordancias. En otras palabras, nunca se puede obtener un fragmento amplio de los textos integrados у rnucho menos su totalidad, de modo que lo que se obtiene son citas textuales ilustrativas del uso de palabras, expresiones о fenomenos gramaticales. Es obligado, eso sf, reconocer en todos los casos la procedencia de los textos devueltos, facilitando los datos bibliograficos pertinentes (autor, tftulo, editorial, etc.). Sin duda, la restriccion de las devoluciones a las concordancias, a veces ampliadas, produce dificultades en el analisis de fenomenos que solo se pueden observar mediante la consideracion de la totalidad del texto. Debe tenerse en cuenta, de todas formas, que no es esa finalidad con la que se construyen habitualmente los corpus de referencia, que, por tanto, no son los recursos adecuados para este otro tipo de investigacion.

A los aspectos legales se anaden cuestiones eticas, sobre todo en el caso de los textos orales que proceden de la grabacion de entrevistas о conversaciones. En todos estos casos es nece- sario contar con la conformidad de las personas que intervienen, frecuentemente con un permiso previo para realizar la grabacion у otro posterior a ella, у el compromiso de los recolectores de garantizar su anonimato у restringir el acceso a las transcripciones a finali- dades vinculadas a la investigacion (noforzosamente lingiustica). El procedimiento utilizado para lograr que las personas intervinientes no puedan ser identificadas consiste en la anoni- mizacion de los nombres de persona, de lugar у de instituciones (que no sean publicos). En definitiva, se trata de impedir que quienes trabajen posteriormente con los fragmentos obtenidos del corpus puedan identificar a las personas que participan en la conversacion о a las personas de las que se esta hablando. Puede lograrse mediante la utilizacion de iniciales, sfmbolos о codigos alfanumericos, pero el mas aconsejable —у tambien el mas trabajoso— consiste en sustituir los nombres originates por otros, ficticios, que resulten congruentes con el contexto social de quienes intervienen у de los lugares que se mencionan. En el caso de los corpus con alineacion de transcripcion у sonido, las zonas correspondientes del audio deben ser eliminadas mediante la grabacion de un sonido externo (un pitido, por ejemplo) que anule el sonido original.

 
<<   CONTENTS   >>

Related topics