From Annotation to Application
Building a Pipeline for Metaphor Language
Metaphors shape the way we speak about almost everything. We talk about burning ambition, heavy responsibilities, or stabbing guilt. These expressions are vivid and powerful, but they are also challenging for researchers and systems that try to analyse them.
Metaphors matter in everyday communication, and also in specific contexts such as health. Patients often describe their experiences in metaphorical terms, and those words influence how their suffering is perceived and managed. Metaphors also matter in politics, migration debates, and cultural narratives. They are everywhere, and they carry meaning.
To capture these meanings, we need more than one tool. We need a way to collect and structure human annotations, a way to test automatic detection, and a way to communicate insights clearly to wider audiences.
This is why I have been building three connected tools: Annotation App (schema-driven datasets), Metaphor Tagger (automatic detection), and Explain My Pain (human-facing reports). Together, they form a pipeline that bridges linguistics, NLP, and intercultural communication.
Step 1: Annotation App
Most annotation platforms are designed by engineers for engineers. They are good at collecting labels but rarely capture the nuances that matter in linguistic research.
The Annotation App is different because it is built from a linguistic schema. That means:
- Fields reflect distinctions from metaphor theory, stance analysis, and intercultural communication.
- Instead of a generic label, you can encode categories like
phenomenon
(metaphor vs literal),stance_tone
(distress, resignation, proactive), ortranslation_shift
(literalisation, metaphorisation, register shift). - Each schema is versioned, so the theoretical framework that guided the annotations is preserved alongside the data.
This approach comes directly from my academic background: categories are not neutral. They shape what researchers can see and what models can learn. The app can be adapted to pain language, but also to political discourse, emotional expression, or intercultural shifts.
┌──────────────────────┐
│ Raw Text Data │
│ (interviews, notes, │
│ surveys, corpora) │
└─────────┬────────────┘
▼
┌──────────────────────┐
│ Annotation App │
│ - Import CSV/JSONL │
│ - Apply schema │
│ - Human annotation │
│ - Export dataset │
└─────────┬────────────┘
Step 2: Metaphor Tagger
The Metaphor Tagger is not a generic keyword matcher. It is rooted in linguistic metaphor theory.
- Its taxonomy draws on conceptual metaphor research: FIRE (intensity), WEIGHT (burden), SHARP OBJECTS (pain), and more.
- The rules are informed by narrative analysis, distinguishing truly metaphorical uses from literal ones in context.
- It does not replace human judgment; it scales linguistic insights across large collections of text.
Pain language is one effective case study, but the same method applies to political metaphors, educational discourse, or climate communication.
┌──────────────────────┐
│ Annotation App │
└─────────┬────────────┘
│ Gold-standard annotations
▼
┌──────────────────────┐
│ Metaphor Tagger │
│ - Auto-detect spans │
│ - Assign categories │
└─────────┬────────────┘
│ System-generated annotations
▼
┌──────────────────────────────┐
│ Evaluation & Comparison │
│ - Tagger vs Human │
│ - Metrics: Precision, Recall│
│ F1, κ │
└──────────────────────────────┘
Step 3: Explain My Pain
Explain My Pain turns model outputs into meaningful feedback for patients and clinicians.
- It highlights metaphors in a patient’s description.
- It explains, in accessible language, why these metaphors matter.
- It suggests how metaphorical language might affect communication in clinical encounters.
This is a case study of how research tools can become accessible applications. The same idea could extend to public discourse (Explain My Politics) or climate narratives (Explain My Climate).
Why all three matter together
- Annotation App captures human expertise in a structured, reproducible way.
- Metaphor Tagger applies linguistic taxonomies automatically at scale.
- Explain My Pain translates insights into practical, human-facing support.
What makes this pipeline unique is not just the technology, but the linguistics behind it. Schemas are grounded in theory. Taxonomies are derived from metaphor research. Outputs are designed with intercultural and communicative applications in mind.
Future directions
The next step is localisation. By annotating parallel English and Spanish corpora, we can explore how metaphors shift across languages and cultures. Does a fire metaphor carry the same weight in Spanish as in English? Do registers change when descriptions are translated for clinical or political contexts?
┌─────────────────────────┐
│ Raw EN/ES Data │
│ (parallel translations, │
│ interviews, corpora) │
└───────────┬─────────────┘
▼
┌─────────────────────────┐
│ Annotation App │
│ - Schema with fields │
│ phenomenon, severity │
│ translation_shift │
│ register │
│ - Parallel_id links │
└───────────┬─────────────┘
▼
┌─────────────────────────┐
│ Metaphor Tagger │
│ - Run on EN corpus │
│ - Run on ES corpus │
└───────────┬─────────────┘
▼
┌───────────────────────────────────┐
│ Evaluation & Intercultural │
│ Analysis │
│ - Compare EN vs ES annotations │
│ - Identify translation shifts │
│ - Report intercultural insights │
└───────────────────────────────────┘
Conclusion
Metaphors are not only figures of speech; they are linguistic realities that shape how we experience the world. People give meaning to their experiences through metaphors, and those metaphors carry weight in health, politics, and everyday life.
With Annotation App, Metaphor Tagger, and Explain My Pain, we can capture, analyse, and share metaphors in ways that are systematic, scalable, and meaningful.
This pipeline is not only about technology. It is about making language visible, comparable, and usable across contexts and cultures.
De la anotación a la aplicación
Un flujo de trabajo para el lenguaje metafórico
Las metáforas moldean la forma en que hablamos de casi todo. Hablamos de ambición ardiente, responsabilidades pesadas o culpa que punza. Estas expresiones son vívidas y poderosas, pero también difíciles para quienes investigan el lenguaje y para los sistemas que intentan analizarlo.
Las metáforas importan en la comunicación cotidiana y también en contextos específicos como la salud. Las personas describen sus experiencias con términos metafóricos, y esas palabras influyen en cómo se percibe y se gestiona su sufrimiento. También importan en la política, en los debates sobre migración y en los relatos culturales. Están en todas partes y cargan significado.
Para capturar estos significados necesitamos más de una herramienta. Necesitamos una forma de recopilar y estructurar anotaciones humanas, una forma de poner a prueba la detección automática y una forma de comunicar hallazgos de manera clara a públicos más amplios.
Por eso construí tres herramientas conectadas: Annotation App (conjuntos de datos basados en esquemas), Metaphor Tagger (detección automática) y Explain My Pain (informes orientados a personas usuarias). En conjunto forman un flujo de trabajo que une lingüística, PLN y comunicación intercultural.
Paso 1: Annotation App
La mayoría de las plataformas de anotación están diseñadas por y para personas ingenieras. Son buenas para recolectar etiquetas, pero rara vez capturan los matices que importan en la investigación lingüística.
Annotation App es distinta porque parte de un esquema lingüístico. Esto implica:
- Los campos reflejan distinciones de la teoría de la metáfora, el análisis de la actitud/posición y la comunicación intercultural.
- En lugar de una etiqueta genérica, puedes codificar categorías como
phenomenon
(metáfora vs literalidad),stance_tone
(desasosiego, resignación, proactividad) otranslation_shift
(literalización, metaforización, cambio de registro). - Cada esquema tiene versión, de modo que el marco teórico que guía la anotación queda preservado junto con los datos.
Esta perspectiva viene de mi formación académica: las categorías no son neutrales. Determinan lo que podemos ver y lo que los modelos pueden aprender. La app puede adaptarse al lenguaje del dolor, pero también al discurso político, a la expresión emocional o a los cambios interculturales.
┌──────────────────────┐
│ Datos textuales │
│ (entrevistas, notas, │
│ encuestas, corpus) │
└─────────┬────────────┘
▼
┌──────────────────────┐
│ Annotation App │
│ - Importar CSV/JSONL│
│ - Aplicar esquema │
│ - Anotación humana │
│ - Exportar dataset │
└─────────┬────────────┘
Paso 2: Metaphor Tagger
Metaphor Tagger no es un buscador de palabras clave genérico. Se basa en la teoría lingüística de la metáfora.
- Su taxonomía se nutre de la metáfora conceptual: FUEGO (intensidad), PESO (carga), OBJETOS CORTANTES (dolor), entre otras.
- Las reglas parten del análisis de narrativas, diferenciando usos verdaderamente metafóricos de usos literales según el contexto.
- No reemplaza el juicio humano; escala ideas lingüísticas a grandes colecciones de texto.
El lenguaje del dolor es un caso de estudio eficaz, pero el método se aplica a metáforas políticas, discurso educativo o narrativas climáticas.
┌──────────────────────┐
│ Annotation App │
└─────────┬────────────┘
│ Anotaciones de referencia
▼
┌──────────────────────┐
│ Metaphor Tagger │
│ - Detección automática │
│ - Asignar categorías │
└─────────┬────────────┘
│ Salidas del sistema
▼
┌──────────────────────────────┐
│ Evaluación y comparación │
│ - Sistema vs humano │
│ - Métricas: Precisión, Recall│
│ F1, κ │
└──────────────────────────────┘
Paso 3: Explain My Pain
Explain My Pain convierte las salidas del modelo en retroalimentación útil para pacientes y profesionales de la salud.
- Resalta metáforas en la descripción de la persona.
- Explica, en lenguaje accesible, por qué importan esas metáforas.
- Sugiere cómo el lenguaje metafórico puede incidir en la comunicación clínica.
Es un caso de cómo las herramientas de investigación pueden transformarse en aplicaciones accesibles. La idea puede extenderse a otros dominios: “Explain My Politics” o “Explain My Climate”.
Por qué las tres juntas
- Annotation App captura el conocimiento humano de forma estructurada y reproducible.
- Metaphor Tagger aplica taxonomías lingüísticas de manera automática y a escala.
- Explain My Pain traduce hallazgos en apoyo práctico y comprensible.
Lo singular de este flujo de trabajo no es solo la tecnología, sino la lingüística que lo sostiene. Los esquemas se anclan en teoría. Las taxonomías derivan de la investigación en metáfora. Las salidas se diseñan con aplicaciones interculturales y comunicativas en mente.
Próximos pasos
El siguiente paso es la localización. Al anotar corpus paralelos en inglés y español, podemos explorar cómo cambian las metáforas entre lenguas y culturas. ¿Una metáfora de fuego pesa igual en español que en inglés? ¿Cambia el registro cuando se traducen descripciones para contextos clínicos o políticos?
┌─────────────────────────┐
│ Datos EN/ES │
│ (traducciones paralelas,│
│ entrevistas, corpus) │
└───────────┬─────────────┘
▼
┌─────────────────────────┐
│ Annotation App │
│ - Esquema con campos │
│ phenomenon, severity │
│ translation_shift │
│ register │
│ - Enlaces parallel_id │
└───────────┬─────────────┘
▼
┌─────────────────────────┐
│ Metaphor Tagger │
│ - EN │
│ - ES │
└───────────┬─────────────┘
▼
┌───────────────────────────────────┐
│ Evaluación e intercambio cultural │
│ - Comparar EN vs ES │
│ - Identificar cambios de traducción│
│ - Reportar hallazgos interculturales│
└───────────────────────────────────┘
Conclusión
Las metáforas no son solo figuras retóricas; son realidades lingüísticas que moldean cómo experimentamos el mundo. Las personas dan sentido a sus vivencias a través de metáforas, y esas metáforas pesan en la salud, la política y la vida cotidiana.
Con Annotation App, Metaphor Tagger y Explain My Pain, podemos capturar, analizar y compartir metáforas de forma sistemática, escalable y significativa.
Este flujo de trabajo no es solo tecnología. Es hacer que el lenguaje sea visible, comparable y utilizable en distintos contextos y culturas.