Valeria de Paiva, Nuance Communications, University of Birmingham

Lógicas e Ontologias: uma proposta nada modesta para o processamento semântico do Português

Slides

Se nós conseguirmos produzir fórmulas lógicas a partir de textos objetivos em Português, muitas aplicações, tais como extração de informacões, sumarização, análise de sentimentos, tradução automática, pesquisa semântica, perguntas e respostas etc. tornam-se factíveis. Mas essas aplicações requerem muitos recursos léxicos. Mesmo para a língua inglesa, que possui, por razões óbvias, o maior número e variedade de recursos léxicos, alguns recursos ainda estão faltando, os recursos existentes não são bem conectados e muita informação que poderia, a princípio, ser obtida pela ligação de recursos existentes, não é fácil de extrair. A situação e muito pior para o português, onde não temos os grandes e longos projetos que acumularam anos-hora de trabalho de linguistas tais como WordNet, ComLex, o Penn TreeBank, VerbNet, FrameNet, GATE, NLTK, Delph-IN, ParGram, GF etc. Junto com colegas eu embarquei num projeto de construir recursos léxicos semelhantes para o português, a longo prazo. Nossa estratégia básica é construir tanto quanto possível automaticamente, mas verificar os resultados obtidos manualmente da melhor forma que conseguirmos. Essa palestra descreve as ferramentas implementadas a partir de 2010 (OpenWorNet-PT e NomLex-PT), as que estamos criando e as que as que planejamos implementar e explica porque elas são úteis.

TecMF: TalksValeria (last edited 2014-09-30 18:41:33 by BrunoLopes)