Where Linguistics Meets NLP: I Am Finally at Home
By Dr. Stella Bullo
From Linguistics to Tech
When I first heard developers talk about tokenisation and lemmatisation, I thought those concepts sounded strangely familiar. They did not seem like exotic new tech terms. I had heard and used them for years. My work with corpus linguistics had taught me how to slice language into parts, trace its roots, and see how meaning shifts with form. For me, this was not jargon. It was a familiar landscape, only now I was walking it with a different compass. Little did I know that my former tech-scared self would end up using these concepts in a fully technical context every day, in front of a console I once treated like a dangerous animal.
Translating Skills Across Worlds
I spent two decades in academia, teaching and researching across the discipline of linguistics: from semantics, morphology and pragmatics to critical discourse analysis, corpus linguistics, conceptual metaphor theory and intercultural communication. Along the way, I wrote books on clichés and evaluative language, examined sentiment in marketing and health communication, analysed fear and resilience during the first months of the COVID-19 pandemic, and explored how language shapes public understanding. These were never just theoretical pursuits. In hindsight, they were the foundations for any technology that hopes to process language as people truly use it.
For me, language was never only a subject to study. It was the lens through which I explored human experience. I examined how we narrate pain, express desire, negotiate identity, and endure suffering. I came to understand how words can carry urgency, intimacy, and resistance, and how a single metaphor can open the door to empathy or close it entirely. In technology, those same skills mark the difference between a tool that merely processes words and one that genuinely understands the people behind them.
Building Tools with Purpose
Then I began building a tool I wished I had during my own years of medical dismissal as an endometriosis patient. At first it was a metaphor tagger, designed as a research aid. Over time it became something more: Explain My Pain, a web application that helps patients describe their pain in ways clinicians can hear. It grew from both a research and a personal need into a tool that could bridge a gap that had long felt unbridgeable.
I did not set out to become a developer. I set out to solve a problem. To do it, I taught myself Python, front-end development, APIs, and, at some point, I realised that I was already halfway through learning natural language processing. I discovered that the processes I had honed as a linguist, such as identifying patterns, mapping meaning and interpreting context, were the same skills that could train a machine to listen more like a human.
Where I Fit Now
NLP appealed to me not only as a technical challenge but also as a new canvas for everything I knew about language. Tokenisation became more than splitting text. It became a way to honour each fragment of someone’s story. Lemmas were not just dictionary forms but the underlying shapes of meaning, stripped of surface distractions. Sentiment analysis was not simply a number on a scale but a way of tracing hope, fear, or determination through the turns of a sentence.
The work demanded precision and empathy. It was code, but it was also culture, pragmatics, idiomatic turns, and discourse markers that revealed more than they seemed to. My experience told me that no algorithm could truly understand language without these layers. Machines could be taught to parse what was said. Linguistics could help them sense why it mattered.
Now I work at an unusual intersection. I am a linguist, a developer, a writer, a researcher, a patient, and a builder. I can design taxonomies of figurative language, parse sentiment in pandemic discourse, map the way metaphor carries fear or resolve across cultures, and turn those insights into working software.
I am interested in the impact linguistics can have in the current world where tech plays a pivotal role. For me, NLP has become more than a set of tools. It is the place where my knowledge of language and my skills in technology belong together. It feels like home. I want to shape tools that do not just process data but understand it in the context of human lives. I want to work where data and human experience meet, where the stakes are high, and where understanding someone better can be just a click away and change what happens next.
This reflection is linked to the app Explain My Pain, which grew out of my academic research project The Language of Endometriosis.
Donde la Lingüística se encuentra con el PLN: Por fin estoy en casa
Por la Dra. Stella Bullo
De la Lingüística a la Tecnología
La primera vez que escuché a desarrolladores hablar de tokenización y lematización, no me sonaron a términos extraños. Eran conceptos que llevaba años utilizando en mis investigaciones. En la lingüística de corpus había aprendido a cortar el lenguaje en partes, a seguirle la pista a sus raíces y a ver cómo el sentido cambia con la forma. No era jerga para mí, era un territorio conocido, solo que ahora lo recorría con una brújula distinta. Lo sorprendente es que aquella versión mía que temía a la tecnología terminaría aplicando estas ideas en un contexto plenamente técnico, frente a una consola que antes veía como un animal peligroso.
Trasladar Habilidades Entre Mundos
Pasé dos décadas en la academia, enseñando e investigando en distintas ramas de la lingüística: semántica, morfología, pragmática, análisis crítico del discurso, metáfora conceptual y comunicación intercultural. Escribí libros sobre clichés y lenguaje evaluativo, analicé la emoción en el marketing y la comunicación en salud, estudié el miedo y la resiliencia en los primeros meses de la pandemia de COVID-19, y exploré cómo las palabras moldean la comprensión pública. Nada de esto fue un ejercicio puramente teórico: en retrospectiva, eran los cimientos de cualquier tecnología que aspire a procesar el lenguaje humano en toda su complejidad.
El lenguaje nunca fue para mí un simple objeto de estudio. Fue el lente a través del cual examiné la experiencia humana: cómo narramos el dolor, expresamos deseos, negociamos identidades o resistimos el sufrimiento. Aprendí que una metáfora puede abrir la puerta a la empatía o cerrarla por completo. En la tecnología, esas mismas competencias marcan la diferencia entre una herramienta que procesa palabras y otra que comprende a las personas detrás de ellas.
Construir Herramientas con Propósito
En un momento decidí crear la herramienta que hubiera querido tener en mis propios años de desestimación médica como paciente de endometriosis. Empezó como un etiquetador de metáforas para la investigación y terminó transformándose en algo más: Explain My Pain, una aplicación web que ayuda a los pacientes a expresar su dolor de un modo que los médicos puedan escuchar. Nació de una necesidad personal y académica, y se convirtió en un puente hacia un entendimiento que parecía inalcanzable.
No me propuse convertirme en desarrolladora. Me propuse resolver un problema. En el camino aprendí Python, desarrollo front-end, APIs, y un día me descubrí a medio camino de aprender procesamiento de lenguaje natural. Reconocí que las destrezas que había afinado como lingüista, tales como identificar patrones, mapear significados, interpretar contextos, eran las mismas que permiten entrenar a una máquina para escuchar de manera más humana.
El Lugar Donde Ahora Pertenezco
El PLN me atrapó no solo como reto técnico, sino como un lienzo nuevo para todo lo que ya sabía del lenguaje. La tokenización dejó de ser cortar texto: pasó a ser una manera de honrar cada fragmento de una historia. Las lemas no eran solo formas de diccionario: eran la esencia del sentido, libre de adornos superficiales. El análisis de sentimiento no era un número en una escala: era una forma de rastrear la esperanza, el miedo o la determinación en el recorrido de una frase.
El trabajo exigía precisión y empatía. Era código, pero también cultura, pragmática, giros idiomáticos, marcadores discursivos que revelaban más de lo que parecía. Mi experiencia me decía que ningún algoritmo podía comprender el lenguaje sin esas capas. Las máquinas pueden aprender a analizar lo que se dice; la lingüística puede enseñarles por qué importa.
Hoy me muevo en una intersección poco común. Soy lingüista, desarrolladora, investigadora, escritora, paciente y constructora. Puedo diseñar taxonomías de lenguaje figurado, analizar el sentimiento en el discurso pandémico, mapear cómo la metáfora transporta miedo o esperanza a través de culturas, y transformar esas observaciones en software funcional.
Me interesa el impacto que puede tener la lingüística en un mundo donde la tecnología ocupa un lugar central. Para mí, el PLN ya no es un conjunto de herramientas: es el espacio donde confluyen mis conocimientos sobre el lenguaje y mis habilidades tecnológicas. Se siente como un hogar. Quiero crear herramientas que no solo procesen datos, sino que los comprendan en el contexto de vidas humanas. Quiero trabajar donde los datos y la experiencia se encuentran, donde las consecuencias son reales, y donde comprender mejor a alguien puede estar a un clic de distancia y cambiar lo que suceda después.
Esta reflexión está vinculada a mi app Explain My Pain, que surgió de mi proyecto de investigación académica El lenguaje de la endometriosis.