D
2014
VYUŽITÍ SOFTWARU STATISTICA PRO ANALÝZU NESTRUKTUROVANÉHO TEXTU NA REZERVAČNÍCH PORTÁLECH
LUSTIGOVÁ, Zdena and Štěpán CHALUPA
Basic information
Original name
VYUŽITÍ SOFTWARU STATISTICA PRO ANALÝZU NESTRUKTUROVANÉHO TEXTU NA REZERVAČNÍCH PORTÁLECH
Name (in English)
The use of STATISTICA SW for the analysis of unstructured text on booking portals
Edition
Opava, p. 215-221, 6 pp. 2014
Publisher
Slezská universita Opava
Other information
Type of outcome
Stať ve sborníku
Field of Study
10103 Statistics and probability
Country of publisher
Czech Republic
Confidentiality degree
není předmětem státního či obchodního tajemství
Publication form
storage medium (CD, DVD, flash disk)
Organization unit
University College Prague – University of International Relations and Institute of Hospitality Management and Economics, Ltd.
Keywords in English
business intelligence; text mining; booking portals; customers review; hotel and spa industry
Tags
International impact, Reviewed
V originále
Článek se zabývá možnostmi využití na českém trhu dostupných textminingových programových balíků k analýze nestrukturovaného textu: jedná se především o multijazyčné informace, které nabízí rezervační portály ve formě zákaznických hodnocení. K testování byl použit SW Statistica a 10080 recenzí na 36 ubytovacích zařízení, dostupných z rezervačního portálu booking.com. Recenze byly vytvořeny v 32 jazykových mutacích. Výsledky testu se neukázaly příliš přínosné, obrovským problémem bylo zejména zpracování vysokého počtu jazykových mutací. Přes veškeré úsilí se téměř polovinu recenzí nepodařilo prostřednictvím SW zpracovat.
In English
Presented article deals with the possibilities of using software packages, available on the Czech market and offering text mining tools, for the analysis of unstructured text, offered by booking portals in the form of multilingual information, hidden in customer reviews. 10080 reviews on 36 accommodation facilities available from booking.com were used to test the Statistica SW. Reviews were created and published in 32 languages. The Statistica SW has not been proven very beneficial, especially in the area of processing multilingual information. Despite all efforts, nearly half of languages used by customers failed to process.
Displayed: 26/12/2024 23:40