MSPS » Data mining

Data mining

Data mining neboli „dolování dat“ je proces získávání zajímavých, ale dosud neznámých informací z vašich dat. Mnohdy je škoda, pokud ve firmě leží ladem zajímavá data, nebo jejich zpracování spočívá pouze ve vytvoření tabulek a grafů v Excelu někým ze zaměstnanců. Vyhodnocujeme například návratnosti kampaní, analyzujeme zákaznické databáze, hledáme souvislosti a možné korelace a snažíme se z dat vypátrat všechno to, co vám pomůže efektivně řídit vaši firmu, projekt či zaměstnance. Projekty jsou realizovány podle světově nejpoužívanější metodologie CRISP-DM. Hlavní důraz klademe na možnost praktického obchodního využití našich zjištění objednavatelem a dobrou znalost marketingového pozadí projektu.

Pro vaši představu si dovolujeme uvést několik námětů, co všechno je možno metodami dataminingu z dat zjistit. Celkový výčet všech možností je však mnohem širší:

Segmentace zákazníků – rozdělíme zákazníky do homogenních skupin podle jejich nákupního chování nebo podle demografických charakteristik. Segmentace slouží k lepšímu cílení marketingu na konkrétní skupiny s určitým chováním a požadavky. Můžeme tak určit z vaší databáze skupinu zákazníků, kteří zareagují nejpravděpodobněji na vaši kampaň a poslat leták právě jim. Tím snížíme náklady na kampaň.

Analýza nákupního košíku – chceme zjistit, které produkty kupují zákazníci společně. Zjišťujeme pravděpodobnost koupení produktu B s produktem A. Například 60% zákazníků, kteří si koupili houpací křeslo, si zároveň koupilo lampu s podstavcem apod. V případě internetových e-shopů tak můžeme určit, které zboží kupují zákazníci společně a dát je na stránkách blízko sebe. V případě „kamenných obchodů“ můžeme na základě těchto analýz umísťovat zboží do regálů, nebo vyškolit prodavače, které zboží mají při nákupu zákazníkovi ještě nabídnout.

Shluková analýza - umožňuje nám určit skupiny zákazníků, kteří jsou vysoce ziskoví a zaměřit se na získání zákazníků s podobným profilem. V oblasti marketingu platí známé Paretovo pravidlo, které říká, že 20 % zákazníků dělá 80 % obratu.

Analýza hodnoty zákazníků – každému zákazníkovi je přiřazena hodnota vyjadřující jeho předpokládanou profitabilitu do budoucna

Risk management – vyjadřuje pravděpodobnost výskytu sledované události. Příkladem může být pravděpodobnost nesplacení půjčky u konkrétního klienta, u kterého známe informace typu věk, plat, vzdělání, počet dětí apod.

Předpověď odchodu ke konkurenci (churn) – úkolem je identifikovat klienty, kteří v určitém období odejdou ke konkurenci. Příkladem může být uzavření účtu. Včasným indikátorem může být snižování aktivity klienta nebo množící se stížnosti na call centru.

Deduplikace a čištění dat – před začátkem analýz musíme data nejdříve vyčistit. Deduplikace odstraní z vašich dat případy, které jsou zjevně stejné, nebo do určité míry podobné (např. klient změnil číslo, přestěhoval se – přesto se jedná v rámci dat o stejného klienta). V rámci čištění dat musíme také odstranit zjevně špatně vyplněné hodnoty a provést další úpravy.

Mezi další námi používané metody patří: rozhodovací stromy, logistická regrese, faktorová analýza, korespondenční analýza, neuronové sítě, korelace, časové řady.

K získání potřebných dat pro data mining slouží firemní CRM systémy, které pomáhají sledovat a vyhodnocovat veškeré obchodní aktivity v rámci celé společnosti. Cílem CRM systémů je především zlepšit cílení služeb, lépe porozumět zákazníkům a identifikovat jejich konkrétní potřeby. To umožňuje budovat dlouhodobě prospěšné vztahy se zákazníky a tím vytěžit z jednoho zákazníka větší zisk.

Matematické a statistické projekty a software