Mi actividad investigadora se centra en dos áreas principales: la evolución de expresiones regulares para la extracción de datos en el contexto de la web y la Administració Electr&ocnica, si bien la tesis doctoral está centrada en el primer área.
My research interests are two-fold. On the one hand, Electronic Government applications and solutions; on the other hand, evolution of regular expressions for data extraction in the context of the Web. In the main, my PhD dissertation entails the second topic.
El objetivo obtener una expresión regular automaticamente y aplicarla a la extración de información en la Web. La expresión regular se obtiene por aprendizaje supervisado, a partir de una serie de ejemplos tanto positivos como negativos de un determinado patró. Por medio de Algoritmos Evolutivos se induce la expresión regular capaz de aceptar todos los ejemplos positivos mientras rechaza los ejemplos negativos.
The goal is to obtain automatically a regular expresion and apply it to the data extraction in the Web. The regular expression is induced using supervised learning. By means of Evolutionary Algorithms the regular expresion, and using a set of positive as well as negative examles, is induced. It is able to acept all the positive samples while it rejects all the negative samples.
La problemática descrita se puede encuadrar dentro de un problema clásico dentro de la Inteligencia Artificial que es la inducción de lenguajes. Tradicionalmente se ha intentado inducir un autómata determinista finito con un número mínimo de estados que represente el lenguaje buscado, sin embargo esta aproximació presenta problemas importantes de escalabilidad y complejidad computacional. Una manera má reciente de abordar esta problemática utiliza ténicas basadas en la Computación Evolutiva.
The problem described above can be identified with a classical problem in the Artifical Intelligence literature, language induction. Traditionally the algorithm inferes a Finite Deterministic Automata with a minimun number of states, however, this aproach presents important problems of scalability and computational complexity. A recent approach to address language induction is rooted in the use of techniques based on Evolutionary Computation.