D
2014
VYUŽITÍ SOFTWARU STATISTICA PRO ANALÝZU NESTRUKTUROVANÉHO TEXTU NA REZERVAČNÍCH PORTÁLECH
LUSTIGOVÁ, Zdena a Štěpán CHALUPA
Základní údaje
Originální název
VYUŽITÍ SOFTWARU STATISTICA PRO ANALÝZU NESTRUKTUROVANÉHO TEXTU NA REZERVAČNÍCH PORTÁLECH
Název anglicky
The use of STATISTICA SW for the analysis of unstructured text on booking portals
Vydání
Opava, od s. 215-221, 6 s. 2014
Nakladatel
Slezská universita Opava
Další údaje
Typ výsledku
Stať ve sborníku
Obor
10103 Statistics and probability
Stát vydavatele
Česká republika
Utajení
není předmětem státního či obchodního tajemství
Forma vydání
paměťový nosič (CD, DVD, flash disk)
Organizační jednotka
University College Prague – Vysoká škola mezinárodních vztahů a Vysoká škola hotelová a ekonomická s.r.o.
Klíčová slova anglicky
business intelligence; text mining; booking portals; customers review; hotel and spa industry
Příznaky
Mezinárodní význam, Recenzováno
V originále
Článek se zabývá možnostmi využití na českém trhu dostupných textminingových programových balíků k analýze nestrukturovaného textu: jedná se především o multijazyčné informace, které nabízí rezervační portály ve formě zákaznických hodnocení. K testování byl použit SW Statistica a 10080 recenzí na 36 ubytovacích zařízení, dostupných z rezervačního portálu booking.com. Recenze byly vytvořeny v 32 jazykových mutacích. Výsledky testu se neukázaly příliš přínosné, obrovským problémem bylo zejména zpracování vysokého počtu jazykových mutací. Přes veškeré úsilí se téměř polovinu recenzí nepodařilo prostřednictvím SW zpracovat.
Anglicky
Presented article deals with the possibilities of using software packages, available on the Czech market and offering text mining tools, for the analysis of unstructured text, offered by booking portals in the form of multilingual information, hidden in customer reviews. 10080 reviews on 36 accommodation facilities available from booking.com were used to test the Statistica SW. Reviews were created and published in 32 languages. The Statistica SW has not been proven very beneficial, especially in the area of processing multilingual information. Despite all efforts, nearly half of languages used by customers failed to process.
Zobrazeno: 22. 11. 2024 01:00