Thursday, July 08, 2010

NEW MATH TRANSLATORS





In the last 25 years, statistical systems that correlate words among 2 languages, have facilitated quick and consistent translations. Online translators analyze parallel texts (Voltaire and Proust in English and French), establishing correspondences among words. Now that Ben Snyder, Regina Barzilay (MIT) and Kevin Knight (Southern California University), have developed deciphering and translation systems of old languages in hours, it is expected that the number of translated languages will be increased (Google translates only 57 languages). However the perfect translation requires a logic synthesis and intuition that computers don't possess (Andrew Robinson). Humans recognize easily the meaning of a word starting from its context. Before it, current PCs needs to duplicate their intuition, narrowing the relationship of the language to decipher with other near related (ancient semitic Ugaritic-Hebrew) and systematizing the correlations (symbols with similar frequencies), of the alphabet to decipher with other near related. Ugaritic alphabet has 30 letters, 29 of which have Hebrew counterparts.

Regina Barzilay, has developed probabilistic technics that infer automatically exact models of natural languages and solve complex tasks of real natural language. Her software (Newsblaster), is able to carry out metanalysis of different news sources conforming appropriate summaries. By means of statistical learning (machine-learning software), she teaches to PCs to carry out better translations, feeding them with a couple of equivalent texts. After recognizing similarities among words (matching), the PC derives its own set of rules, establishing new sentences, estimating the probability that each interpretation is correct. Newsblaster recognizes 80% of similarities, summarizing cognates, words with common roots, prefixes, suffixes, recognizing cognates of tripartite structure in another languages. Newsblaster uses frequencies of symbolic mappings between one and another related language, selecting mapping that are identified better with consistent sets of suffixes and prefixes. Although the system doesn't use contextual information to solve ambiguities, the goal of this study is to incorporate logic and intuition used by human decipherers in an unsupervised statistical model.

NUEVOS TRADUCTORES MATEMATICOS

En los últimos 25 años, sistemas estadisticos que correlacionan palabras entre 2 idiomas, han posibilitado traducciones rapidas y consistentes. Los traductores online analizan textos paralelos (Voltaire y Proust en ingles y francés), estableciendo correspondencias entre palabras. Ahora que Ben Snyder, Regina Barzilay (MIT) y Kevin Knight (Southern California University), han desarrollado sistemas de desciframiento y traducción de lenguajes antiguos en horas, se espera que el número de lenguajes traducidos se incremente (Google solo traduce 57 lenguajes). Empero, la traducción perfecta requiere una sintesis de lógica e intuición, que las computadoras no poseen (Andrew Robinson). Los humanos reconocen facilmente el significado de una palabra a partir de su contexto. Ante ello, las PCs actuales necesitan duplicar su intuición, estrechando la relación del lenguaje a descifrar con otro cercano (Ugaritico-Hebreo) y sistematizando las correlaciones (simbolos con frecuencias similares), del alfabeto por descifrar con otro cercano. El alfabeto Ugaritico tiene 30 letras, 29 de las cuales tienen contrapartes hebreas.

Regina Barzilay, ha desarrollado técnicas probabilisticas que infieren automaticamente modelos exactos de lenguajes naturales y resuelven tareas complejas de procesamiento del lenguaje natural real. Su software (Newsblaster), es capaz de realizar metaanalisis de diferentes fuentes de noticias conformando resúmenes apropiados. Mediante aprendizaje estadistico (machine-learning software), enseña a las PCs a realizar mejores traducciones, alimentandolas con un par de textos equivalentes. Tras reconocer las similaridades entre palabras (matching), la PC deriva su propio set de reglas, estableciendo nuevas frases, estimando la probabilidad de que cada interpretación sea correcta. Newsblaster reconoce un 80% de similaridades, sumarizando cognatos, palabras con raices comunes, prefijos, sufijos, reconociendo cognatos en otro lenguajes de estructura tripartita. Newblaster emplea frecuencias de mapeos simbólicos entre uno y otro lenguaje, seleccionando los mapeos que se identifican mejor con sets consistentes de sufijos y prefijos. Aunque el sistema no usa información contextual para resolver ambigüedades, el objetivo principal de este estudio es incorporar la lógica e intuición usada por descifradores humanos en un modelo estadístico no supervisado.

No comments: