Contenido de XSL

Minería de Datos Textuales

Centro
Facultad de Informática
Titulación
Grado en Inteligencia Artificial
Curso académico
2023/24
Curso
3
Nº Créditos
6
Idiomas
Castellano
Euskera

DocenciaAlternar navegación

Distribución de horas por tipo de enseñanza
Tipo de docenciaHoras de docencia presencialHoras de actividad no presencial del alumno/a
Magistral4060
P. Laboratorio2030

Guía docenteAlternar navegación

ObjetivosAlternar navegación

1. Comprender los principales conceptos sobre la minería de datos textuales y la tecnología del lenguaje, y tener una visión global del área.

2. Entender y utilizar las herramientas y recursos.

3. Entender como se estructuran las aplicaciones de minería de datos textuales.

4. Analizar una aplicación concreta e identificar las opciones y ventajas de utilizar técnicas de minería de datos textuales para afrontarlo.

5. Diseñar e implementar aplicaciones concretas que utilicen minería de datos textuales.

6. Utilizando métodos empíricos, diseñar y llevar a cabo los experimentos necesarios para conocer el rendimiento de aplicaciones concretas.

TemarioAlternar navegación

Herramientas y recursos:

- Rastreo, obtención y limpieza de documentos desde Internet y redes sociales (crawling)

- Librerías de procesamiento de lenguaje

- Recursos semánticos

- Técnicas de clasificación y agrupación de documentos



Aplicaciones:

- Busqueda

- Extracción

- Sistemas de pregunta-respuesta

- Minería de opiniones

- Traducción automática

MetodologíaAlternar navegación

Además de las clases magistrales, se realizarán prácticas y laboratorios obligatorios en el ordenador. Estas se organizarán de tal manera que complementen a lo explicado en las clases teóricas. El objetivo de las clases prácticas es por un lado, promover el trabajo continuo, y por el otro, poder realizar una evaluación continua. El objetivo de la práctica es el poder aplicar lo aprendido a distintos problemas y el trabajar la creatividad del alumnado.



En los tipos de docencia, magistral y práctico, se usarán metodologías activas. Esto es, el alumnado participará de manera activa tanto en clase como en el laboratorio.

Sistemas de evaluaciónAlternar navegación

En la asignatura se aplicará el Protocolo sobre ética académica y prevención de las prácticas deshonestas o fraudulentas en las pruebas de evaluación y en los trabajos académicos en la UPV/EHU.



La asignatura tiene dos modos de evaluación: evaluación continua y evaluación final.



La preinscripción en el modo de evaluación continua se realizará al principio del curso. La preinscripción pasará a ser definitiva tras la confirmación de la solicitud por parte del estudiante en las fechas que se establezcan (entre el 60% y el 80% del curso) y previa verificación del rendimiento parcial por parte del profesorado. Si en las mencionadas fechas el/la alumno/a no confirma su inscripción definitiva en evaluación continua se entenderá que renuncia a la misma.







EVALUACIÓN CONTINUA



- % 50 Entregas de los laboratorios y resultados de los test de evalución

- % 50 Práctica individual



Todas las pruebas y actividades mencionadas para la evaluación continua son obligatorias.



Las condiciones para aprobar en la evaluación continua son:

- Conseguir al menos el 30% de la puntuación en cada actividad de laboratorio

- Conseguir un 40% de la nota de la práctica

- Conseguir, después de un cálculo porcentual, un 50% o más de la nota.



Si la/el alumna/o no expresa en plazo su renuncia a la evaluación continua y no cumple alguna de las condiciones para superar la evaluación continua, suspenderá la asignatura en la convocatoria ordinaria y podrá optar a la convocatoria extraordinaria. Si no presentara la práctica, se le evaluaría como no presentado.







EVALUACIÓN FINAL



- 50% Prueba escrita

- 50% Práctica individual



Para poder presentarse a la prueba escrita, habrá que haber entregado previamente la práctica individual. Todas las pruebas y actividades mencionadas son obligatorias.





Las condiciones para aprobar en la evaluación final son:



- Conseguir al menos el 40% de la puntuación en la prueba escrita

- Conseguir un 40% de la nota de la práctica

- Conseguir, después de un cálculo porcentual, un 50% o más de la nota.



Si la/el alumna/o no realiza la prueba escrita se entiende que renuncia a la evaluación. Si no presentara la práctica, se le evaluaría como no presentado.

Materiales de uso obligatorioAlternar navegación

El material disponible en la plataforma virtual (eGela).

BibliografíaAlternar navegación

Bibliografía básica

Jurafsky D., Martin J. H. Speech and Language Processing (3rd edition draft). An Introduction to Natural Language Processing, Computational Linguistics and Speech Recognition. Prentice Hall, 2018. https://web.stanford.edu/~jurafsky/slp3/

GruposAlternar navegación

01 Teórico (Castellano - Mañana)Mostrar/ocultar subpáginas

Calendario
SemanasLunesMartesMiércolesJuevesViernes
16-30

10:30-12:00

12:00-13:30

Profesorado

01 P. Laboratorio-1 (Castellano - Mañana)Mostrar/ocultar subpáginas

Calendario
SemanasLunesMartesMiércolesJuevesViernes
16-30

09:00-10:30

Profesorado

46 Teórico (Euskera - Tarde)Mostrar/ocultar subpáginas

Calendario
SemanasLunesMartesMiércolesJuevesViernes
16-30

15:30-17:00

17:00-18:30

Profesorado

46 P. Laboratorio-1 (Euskera - Tarde)Mostrar/ocultar subpáginas

Calendario
SemanasLunesMartesMiércolesJuevesViernes
16-30

14:00-15:30

Profesorado