Transcript
Data Mining w e-commerce Cz. 2
• • • •
szablony wyszukiwania reguł asocjacyjnych generowanie drzewa decyzyjnego reguły decyzyjne
1. Szablony • • • •
Szablony: najprotsza forma wzorców Problem wyszukiwania szablonów Algorytmy odkrywania szablonów Zastosowania szablonów
Zbiór danych:szablony • Obiekty • Atrybuty – rzeczywiste
– symboliczne
• System informacyjny • System decyzyjny
Problemy • • • • •
Znaleźć regularne zjawiska w danej tablicy który szablon jest bardziej interesujący? Dekompozycja dużych tablic Odkrywanie charakterystyk Jak wykrywać szablony dla tablic zachowanych w bazach danych (SQL, OQL)
Reguły asocjacyjne • Problem wyszukiwania reguł asocjacyjnych • Algorytm odkrywania reguł asocjacyjnych • Zastosowania (katalogi, rozmieszczenie towarów w sklepie, segmentacja klientów, diagnoza awarii, itp..)
Drzewa decyzyjne • Problem generowania optymalnego drzewa decyzyjnego • Konstrukcja drzew decyzyjnych • Zagadnienia praktyczne • Zastosowanie w problemie klasyfikacji
Dlaczego ? • Proces klasyfikacji jest efektywny obliczeniowo
• O ile drzewa nie są zbyt skomplikowane, reprezentacja ta jest czytelna dla człowieka • Istnieje łatwa możliwość przejścia od drzew decyzyjnych do reguł decyzyjnych.ż
Przycinanie drzewa • zasada krótkiego opisu: skracamy opis kosztem dokładności klasyfikacji w zbiorze treningowym • zastąpienie podrzewa nowym liściem (przycinanie) lub mniejszym podrzewem.
reguły decyzyjne • Reguły decyzyjne: prosty opis klas decyzyjnych • Problem wyszukiwania reguł decyzyjnych • Algorytmy generowania reguł decyzyjnych (Sekwencyjne pokrywanie,Algorytm AQ)