Glosario militar de la segunda guerra mundialTrabajo de extracción terminológica y de lingüística de corpus mediante el análisis de textos de época
- María Gabriela Fernández Díaz Directeur/trice
Université de défendre: Universidad de Sevilla
Fecha de defensa: 06 juillet 2017
- María Luisa Calero Vaquera President
- José Enrique García González Secrétaire
- Isidro Pliego Sánchez Rapporteur
- Chelo Vargas Sierra Rapporteur
- María del Mar Rivas Carmona Rapporteur
Type: Thèses
Résumé
Procedemos seguidamente a detallar, de forma somera, los archivos y el contenido de esta investigación. Dicho trabajo ha quedado dividido y estructurado de la siguiente manera: Un parte teórica (cuyo título es 2. Tesis doctoral. Parte teórica), dividida en once capítulos, en donde reside la fundamentación básica de nuestro trabajo, habiendo sido redactada en lengua española. En ella detallamos los motivos que nos animaron a llevarla a cabo y los objetivos que deseábamos obtener con ella. Se trata de un estudio de análisis de la terminología empleada durante la Segunda Guerra Mundial mediante el empleo de la terminología, de la lingüística de corpus y de las herramientas informáticas creadas para tal fin, con el propósito de implementar dichas metodologías. Nuestra labor ha sido la de cubrir un vacío descriptivo del uso real de las unidades terminológicas en el seno del ámbito militar. No obstante, y al ser ésta una ardua tarea, nuestra investigación ha quedado limitada al estudio del teatro de operaciones europeo, del Mediterráneo y del norte de África y a las operaciones terrestres. Seguidamente exponemos la historia, su definición y la evolución que ha sufrido la lingüística de corpus, y la importancia que las nuevas tecnologías han tenido en dicho desarrollo. Asimismo, detallamos su definición y los motivos por los que ciertos investigadores la consideran disciplina o método, dependiendo de la importancia que se le atribuya a los resultados que han sido extraídos del corpus. En el capítulo dedicado a la terminología, segunda metodología empleada en nuestro trabajo, describimos su historia y su evolución procediendo, a continuación, a su definición. Al igual que ocurriera en la lingüística de corpus, existen voces que han puesto en tela de juicio sus premisas teóricas. Debido a ello, analizaremos las posturas que sostienen los defensores de la tesis tradicional y los motivos por los que otros promueven un cambio para que la terminología sea considerada disciplina. Tras ello, hemos expuesto la idoneidad del uso de los corpus a la hora de individuar, analizar y definir las unidades terminológicas en el seno de cada disciplina. Continuamos detallando los pasos a seguir para compilar un corpus que cumpla con los requisitos y objetivos estipulados, al igual que los diferentes métodos empleados en el trabajo terminológico. Finalmente enumeramos los dos tipos de herramientas a disposición de los terminólogos diseñadas mediante dos enfoques diferentes: el lingüístico y el estadístico. En el siguiente capítulo detallamos los pasos ejecutados en nuestro proceso de extracción terminológica. Describimos las premisas teóricas seleccionadas para delimitar nuestro trabajo, al igual que su aplicación y objetivos. De igual modo, identificamos los textos seleccionados para el estudio terminológico, las herramientas informáticas empleadas para tal efecto y el desarrollo que ha seguido nuestra labor de análisis terminológica. Finalmente, exponemos nuestras consideraciones con respecto al trabajo de extracción terminológica, su evolución, métodos de análisis empleados y los resultados obtenidos. Por último, valoramos nuestra labor y la comparamos con el proceso de ordenación terminológica efectuado en los años cuarenta del pasado siglo; sus deficiencias y sus posibles mejoras con el propósito de continuar dicho estudio de una manera más detallada y con unos objetivos más ambiciosos. El archivo titulado 3. Tesis doctoral. Parte Práctica, alberga los resultados de nuestro estudio, que no son otros que un glosario terminológico militar de la Segunda Guerra Mundial. Dicho glosario consta de 748 páginas y contiene 3.090 términos. Este análisis terminológico se ha centrado en las operaciones terrestres efectuadas en los continentes europeo y africano, quedando excluidas las operaciones navales y aéreas y la guerra en el Pacifico. Dicha parte de la tesis ha sido redactada en lengua inglesa, al estar en dicho idioma los textos que hemos empleado para la creación de nuestro corpus. En ella no solo se incluyen las unidades terminológicas normalizadas durante ese espacio temporal, sino las normalizadas, a posteriori, las que han sido asimiladas al lenguaje general (convirtiéndose en unidades léxicas), aquellas que no habían sido incluidas previamente en ningún glosario y que (después de consultar a un experto o de hallar su definición en contexto) hemos identificado en nuestro trabajo, además de las unidades terminológicas procedentes de otras lenguas que formaron parte del lenguaje de especialidad militar a partir de dicho conflicto. La carpeta denominada 4. Lista de textos enumera los textos que han sido empleados en nuestra investigación. Se trata del Intelligence Bulletin, revista publicada por el War Department norteamericano, en donde se detallan nuevas estrategias, tácticas y armamentos, tanto de las Fuerzas del Eje como Aliadas. Los números de esta publicación fueron editados entre septiembre de 1942 y junio de 1946 aunque, a partir de julio de 1945, su tirada dejó de ser mensual. A pesar de contener un limitado número de palabras (285.214), su carácter de representatividad ha sido fundamental a la hora de identificar el léxico especializado de dicha disciplina. En 5. Textos sin etiquetar, se encuentran los artículos de las publicaciones descritas con anterioridad en texto plano (o formato txt) sin etiquetar, las cuales han sido empleadas durante el proceso de extracción terminológica sobre base estadística y lingüista, en particular, durante el proceso de búsqueda de unidades terminológicas simples. Finalmente, el fichero de nombre 6. Textos con etiquetado gramatical, incluye los mismos escritos detallados arriba, pero que poseen su correspondiente anotación gramatical. Para tal efecto, se seleccionó la anotación CLAWS 7 (the Constituent Likelihood Automatic Word-tagging System, Seventh Version), proporcionada por UCREL (The University Centre for Computer Corpus Research on Language), organismo perteneciente a la Universidad de Lancaster. Con ellos se procedió a ejecutar el análisis de extracción terminológica sobre base estadística, en particular, durante el proceso de búsqueda de unidades terminológicas complejas.