Mire jó a klaszteranalízis?
Irta: postaimre - Datum: 2014. March 11. 13:02:45
A klaszteranalízis kiindulópontja az elemek közötti hasonlóság vagy távolság. Ezzel kapcsolatban általában rendelkezünk elõzetes információkkal, amelyek alapján kiszámítjuk ezeket a hasonlóságokat vagy távolságokat. Más esetekben csak a hasonlóságok vagy távolságok mértékérõl rendelkezünk információkkal.

Teljes hir
A klaszteranalízis kiindulópontja az elemek közötti hasonlóság vagy távolság. Ezzel kapcsolatban általában rendelkezünk elõzetes információkkal, amelyek alapján kiszámítjuk ezeket a hasonlóságokat vagy távolságokat. Más esetekben csak a hasonlóságok vagy távolságok mértékérõl rendelkezünk információkkal.

Az elõbbi esetben a klaszteranalízis (cluster = fürt (angol)) segítségével vizsgált probléma a következõ: egy n elemû adatbázisban minden egyes elemhez p darab változó értékei kapcsolódnak; alakítsunk az elemekbõl csoportokat úgy, hogy a „hasonlóak” egy csoportba kerüljenek. Minden klaszter elemei viszonylag hasonlók egymáshoz, de különböznek más klaszterek elemeitõl. Az eljárásnak teljes mértékben számszerûnek kell lennie, a csoportok száma pedig elõzetesen nem ismert. Így nehezebb problémával állunk szemben, mint a diszkriminancia-analízis esetében, hiszen ez utóbbi esetben a csoporttagságok ismertek. A klaszteranalízis és a diszkriminancia-analízis is csoportosítással foglalkozik. A diszkriminancia-analízis megköveteli a klaszterekbe tartozás elõzetes ismeretét, s ez alapján kialakít egy csoportosító szabályt. Ezzel szemben a klaszteranalízisnél nem rendelkezünk elõzetes ismerettel, a csoportok az adatok alapján alakulnak ki.

A klaszteranalízis több szempontból is igen hasznos eljárás. Elõször is, gyakran szükség van arra, hogy a „valódi” csoportokat határozzuk meg. Például, többféle módon csoportosíthatjuk a vásárlói magatartásformákat - különbözõ elméleteknek megfelelõen -, a klaszteranalízis egy objektív módszert kínál a csoportok kialakításához. Másodszor, a klaszteranalízist adatredukció céljából is használhatjuk. Az adatredukcióról a fõkomponens-analízis kapcsán már részletesebben volt szó. Harmadrészt a klaszteranalízis segítségével kapott esetleg meglepõ klaszter-csoportosulások új fényt vethetnek az eddig vizsgált kapcsolatok rendszerére.
Link