LUSTIGOVÁ, Zdena and Štěpán CHALUPA. VYUŽITÍ SOFTWARU STATISTICA PRO ANALÝZU NESTRUKTUROVANÉHO TEXTU NA REZERVAČNÍCH PORTÁLECH (The use of STATISTICA SW for the analysis of unstructured text on booking portals). Opava: Slezská universita Opava, 2014, p. 215-221, 6 pp. ISBN 978-80-7248-955-8.
Other formats:   BibTeX LaTeX RIS
Basic information
Original name VYUŽITÍ SOFTWARU STATISTICA PRO ANALÝZU NESTRUKTUROVANÉHO TEXTU NA REZERVAČNÍCH PORTÁLECH
Name (in English) The use of STATISTICA SW for the analysis of unstructured text on booking portals
Authors LUSTIGOVÁ, Zdena and Štěpán CHALUPA.
Edition Opava, p. 215-221, 6 pp. 2014.
Publisher Slezská universita Opava
Other information
Original language Czech
Type of outcome Proceedings paper
Field of Study 10103 Statistics and probability
Country of publisher Czech Republic
Confidentiality degree is not subject to a state or trade secret
Publication form storage medium (CD, DVD, flash disk)
Organization unit University College Prague – University of International Relations and Institute of Hospitality Management and Economics, Ltd.
ISBN 978-80-7248-955-8
Keywords in English business intelligence; text mining; booking portals; customers review; hotel and spa industry
Tags International impact, Reviewed
Changed by Changed by: doc. RNDr. Zdena Lustigová, CSc., učo 12440. Changed: 17/2/2015 12:33.
Abstract
Článek se zabývá možnostmi využití na českém trhu dostupných textminingových programových balíků k analýze nestrukturovaného textu: jedná se především o multijazyčné informace, které nabízí rezervační portály ve formě zákaznických hodnocení. K testování byl použit SW Statistica a 10080 recenzí na 36 ubytovacích zařízení, dostupných z rezervačního portálu booking.com. Recenze byly vytvořeny v 32 jazykových mutacích. Výsledky testu se neukázaly příliš přínosné, obrovským problémem bylo zejména zpracování vysokého počtu jazykových mutací. Přes veškeré úsilí se téměř polovinu recenzí nepodařilo prostřednictvím SW zpracovat.
Abstract (in English)
Presented article deals with the possibilities of using software packages, available on the Czech market and offering text mining tools, for the analysis of unstructured text, offered by booking portals in the form of multilingual information, hidden in customer reviews. 10080 reviews on 36 accommodation facilities available from booking.com were used to test the Statistica SW. Reviews were created and published in 32 languages. The Statistica SW has not been proven very beneficial, especially in the area of processing multilingual information. Despite all efforts, nearly half of languages used by customers failed to process.
PrintDisplayed: 16/6/2024 22:00