D 2014

VYUŽITÍ SOFTWARU STATISTICA PRO ANALÝZU NESTRUKTUROVANÉHO TEXTU NA REZERVAČNÍCH PORTÁLECH

LUSTIGOVÁ, Zdena and Štěpán CHALUPA

Basic information

Original name

VYUŽITÍ SOFTWARU STATISTICA PRO ANALÝZU NESTRUKTUROVANÉHO TEXTU NA REZERVAČNÍCH PORTÁLECH

Name (in English)

The use of STATISTICA SW for the analysis of unstructured text on booking portals

Authors

LUSTIGOVÁ, Zdena and Štěpán CHALUPA

Edition

Opava, p. 215-221, 6 pp. 2014

Publisher

Slezská universita Opava

Other information

Language

Czech

Type of outcome

Stať ve sborníku

Field of Study

10103 Statistics and probability

Country of publisher

Czech Republic

Confidentiality degree

není předmětem státního či obchodního tajemství

Publication form

storage medium (CD, DVD, flash disk)

Organization unit

University College Prague – University of International Relations and Institute of Hospitality Management and Economics, Ltd.

ISBN

978-80-7248-955-8

Keywords in English

business intelligence; text mining; booking portals; customers review; hotel and spa industry

Tags

International impact, Reviewed
Změněno: 17/2/2015 12:33, doc. RNDr. Zdena Lustigová, CSc.

Abstract

V originále

Článek se zabývá možnostmi využití na českém trhu dostupných textminingových programových balíků k analýze nestrukturovaného textu: jedná se především o multijazyčné informace, které nabízí rezervační portály ve formě zákaznických hodnocení. K testování byl použit SW Statistica a 10080 recenzí na 36 ubytovacích zařízení, dostupných z rezervačního portálu booking.com. Recenze byly vytvořeny v 32 jazykových mutacích. Výsledky testu se neukázaly příliš přínosné, obrovským problémem bylo zejména zpracování vysokého počtu jazykových mutací. Přes veškeré úsilí se téměř polovinu recenzí nepodařilo prostřednictvím SW zpracovat.

In English

Presented article deals with the possibilities of using software packages, available on the Czech market and offering text mining tools, for the analysis of unstructured text, offered by booking portals in the form of multilingual information, hidden in customer reviews. 10080 reviews on 36 accommodation facilities available from booking.com were used to test the Statistica SW. Reviews were created and published in 32 languages. The Statistica SW has not been proven very beneficial, especially in the area of processing multilingual information. Despite all efforts, nearly half of languages used by customers failed to process.