Tokenizing Preprocessing

Tokenizing is the process of breaking down text into smaller units, called tokens, such as words, phrases, or symbols. This step is crucial for text analysis as it converts unstructured text into a structured format that can be easily processed and analyzed.

No Filtering (Stopwords) Tokenizing
931 pelayanan ramah dan memuaskan ['pelayanan', 'ramah', 'dan', 'memuaskan']
932 alhamdulillahrsu X tempatnya nyaman dan pelayanannya memuaskan ['alhamdulillahrsu', 'queen', 'latifa', 'tempatnya', 'nyaman', 'dan', 'pelayanannya', 'memuaskan']
933 pelayanannya baik dan pegawai ramah ['pelayanannya', 'baik', 'dan', 'pegawai', 'ramah']
934 pelayanan baik cepat dan ramah ['pelayanan', 'baik', 'cepat', 'dan', 'ramah']
935 pelayanan baik petugas juga ramah ['pelayanan', 'baik', 'petugas', 'juga', 'ramah']
936 pelayananya baik stafnya ramah ['pelayananya', 'baik', 'stafnya', 'ramah']
937 pelayanannya cepat petugas ramah ['pelayanannya', 'cepat', 'petugas', 'ramah']
938 pelayanan memuaskanharga terjangkaucepat dan ramah ['pelayanan', 'memuaskanharga', 'terjangkaucepat', 'dan', 'ramah']
939 perbaiki sistem pemanggilsound system suara tidak jelas ['perbaiki', 'sistem', 'pemanggilsound', 'system', 'suara', 'tidak', 'jelas']
940 pelayanannya bagus petugas ramah saya dilayani dengan cepat ['pelayanannya', 'bagus', 'petugas', 'ramah', 'saya', 'dilayani', 'dengan', 'cepat']