CENG 643

Veri Madenciliğinde Örüntü Keşfi

Bu ders öğrencileri büyük ölçekli veride sık bulunan örüntüleri bulmayı amaçlayan, veri madenciliği alanının en erken bulunan ve en çok kullanılan işi olan örüntü keşfi (örüntü madenciliği veya sık örüntü madenciliği veya kural madenciliği) ile tanıştırır. Sık örüntüler market-sepet verisi analizi, yazılım hataları madenciliği, web tıklarının analizi, metin işleme, resim işleme gibi birçok alanda önemlidir. Bu ders, bu alanı algoritmik, değişim, ölçeklenebilirlik, veri tipleri ve uygulamalar açısından ele alacaktır. İncelenecek konular; sık örüntü madenciliği, sıkıştırmada örüntüler, devingen veride (akış, dizi ve uzaysal zamansal) örüntüler, büyük veride sık örüntü madenciliği, sınıflandırma ve kümelemede örüntü madenciliği ve örüntü madenciliğinde gizliliktir.

Dersin Amacı

Bu ders öğrencileri sık kümeler madenciliği alanındaki güncel gelişmeler ile tanıştırırken, kullanım alanları, algoritmaları, veri yapıları, ölçeklenebilirlikleri ve uygulamaları açısından geniş bir bakış açısı sunar.

Kaynakça

C.C. Aggarwal and J. Han. Frequent Pattern Mining, Springer, 2014 ,J. Han, M. Kamber, J. Pei. Data Mining Concepts and Techniques, Morgan-Kaufmann-Series-in-Data-Management-Systems, 2012 ,P-N. Tan, M. Steinbach, A. Karpatne, V. Kumar, Introduction to Data Mining (2nd Edition), Pearson, 2019

Öğrenim Çıktıları

1 .Sık örüntü madencliğinde güncel araştırma ve teknoloji akımlarını öğrenme,

2. Alanın temel prensiplerini kavrama,

3. Veri yoğun uygulamalarda örüntü madenciliği işlerini yerleştirme ve darboğaz noktalarını belirleyebilmede uygun tasarım kararları alabilme,

4. Alanının yayınlarını okuma-anlama-sunma ve tartışma yeteneği kazanma.

Topics
Sık Örüntü Madenciliği Algoritmaları
Uzun Örüntü Madenciliği
Sıkıştırma Temelli Örüntü Modelleri
Veri Madenciliğinde MDL
Akış Versinde Sık Örüntü Madenciliği
Dizi Verisinde Örüntü Madenciliği
Uzaysal Zamansal Veride Örüntü Madenciliği
Paralel Sık Örüntü Madenciliği
Paralel Dizi Madenciliği
Çizge Örüntü Madenciliği
Kümelemede Sık Örüntü Madenciliği
Sınıflandırmada Öğretilmiş Örüntü Madenciliği
Girdi Gizliliği
Çıktı Gizliliği

Notlandırma

Kısa Sınav 20%

Ödev  20%

Derse Katılım 20%

Final  40 %