CENG 464

Metin Madenciliği

Bu derste, temel doğal dil işleme teknikleri, belge temsili, metin sınıflandırma ve kümeleme, belge özetleme, duygu analizi, sosyal ağ ve sosyal medya analizi, olasılıklı konu modelleri ve metin görselleştirme dahil olmak üzere metin madenciliğindeki önemli konuları ele alacağız.

Dersin Amacı

Bu ders, gerçek veri kümeleri ve metin madenciliği araçları kullanarak Python ile metin madenciliği ve veri analitiğinin temel bileşenlerini öğrenme fırsatı sunar. Metin ön işleme, duygu analizi ve konu modelleme dahil olmak üzere temel metin madenciliği tekniklerinde uygulamalı deneyim sağlar ve öğrencilerin bir veri bilimcisi olarak eğitilmesine yardımcı olur.

Kaynakça

J. Eisenstein,” Introduction to Natural Language Processing”, MIT Press, 2019. ,S. Ghosh & D.Gunning, “Natural Language Processing Fundamentals”, Packt, 2019.

Öğrenme Çıktıları

1. Python ve NLTK kullanarak metin sınıflandırıcı oluşturabilme ve temel doğal dil işleme problemlerini çözebilme
2. Python kullanarak veri analizi ve makine öğrenmesi uygulamaları geliştirebilme
3. Hesaplamalı dilbilimin temellerini anlama
4. Genel doğal dil işleme uygulama modelleri oluşturabilme
5. Bir modelin performansını doğru metriklerle değerlendirebilme
6. Metinden görselleştirme, niceleme ve keşif analizi gerçekleştirebilme

Konular
Giriş
Doğal Dil İşleme Adımları
Doğal Dil İşleme Adımları
Belge Gösterimi
Belge Gösterimi
Metin Sınıflandırması
Metin Gruplama
Veri Toplama
Konu Modelleme
Metin Özetleme
Metin Oluşturma
Sosyal Medya ve Ağ Analizi
Duygu Analizi
Metin Görselleştirme

Notlandırma

Vize 25%

Araştırma Sunumu 35%

Final 40%