D 2014

VYUŽITÍ SOFTWARU STATISTICA PRO ANALÝZU NESTRUKTUROVANÉHO TEXTU NA REZERVAČNÍCH PORTÁLECH

LUSTIGOVÁ, Zdena a Štěpán CHALUPA

Základní údaje

Originální název

VYUŽITÍ SOFTWARU STATISTICA PRO ANALÝZU NESTRUKTUROVANÉHO TEXTU NA REZERVAČNÍCH PORTÁLECH

Název anglicky

The use of STATISTICA SW for the analysis of unstructured text on booking portals

Autoři

LUSTIGOVÁ, Zdena a Štěpán CHALUPA

Vydání

Opava, od s. 215-221, 6 s. 2014

Nakladatel

Slezská universita Opava

Další údaje

Jazyk

čeština

Typ výsledku

Stať ve sborníku

Obor

10103 Statistics and probability

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

paměťový nosič (CD, DVD, flash disk)

Organizační jednotka

University College Prague – Vysoká škola mezinárodních vztahů a Vysoká škola hotelová a ekonomická s.r.o.

ISBN

978-80-7248-955-8

Klíčová slova anglicky

business intelligence; text mining; booking portals; customers review; hotel and spa industry

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 17. 2. 2015 12:33, doc. RNDr. Zdena Lustigová, CSc.

Anotace

V originále

Článek se zabývá možnostmi využití na českém trhu dostupných textminingových programových balíků k analýze nestrukturovaného textu: jedná se především o multijazyčné informace, které nabízí rezervační portály ve formě zákaznických hodnocení. K testování byl použit SW Statistica a 10080 recenzí na 36 ubytovacích zařízení, dostupných z rezervačního portálu booking.com. Recenze byly vytvořeny v 32 jazykových mutacích. Výsledky testu se neukázaly příliš přínosné, obrovským problémem bylo zejména zpracování vysokého počtu jazykových mutací. Přes veškeré úsilí se téměř polovinu recenzí nepodařilo prostřednictvím SW zpracovat.

Anglicky

Presented article deals with the possibilities of using software packages, available on the Czech market and offering text mining tools, for the analysis of unstructured text, offered by booking portals in the form of multilingual information, hidden in customer reviews. 10080 reviews on 36 accommodation facilities available from booking.com were used to test the Statistica SW. Reviews were created and published in 32 languages. The Statistica SW has not been proven very beneficial, especially in the area of processing multilingual information. Despite all efforts, nearly half of languages used by customers failed to process.