Tokenizing Preprocessing

Tokenizing is the process of breaking down text into smaller units, called tokens, such as words, phrases, or symbols. This step is crucial for text analysis as it converts unstructured text into a structured format that can be easily processed and analyzed.

No Filtering (Stopwords) Tokenizing
941 pelayanan di resepsionis buruk ['pelayanan', 'di', 'resepsionis', 'buruk']
942 tempat ternyaman untuk keluarga dan masyarakat beroba pelayan sangat ramah ['tempat', 'ternyaman', 'untuk', 'keluarga', 'dan', 'masyarakat', 'beroba', 'pelayan', 'sangat', 'ramah']
943 ramahpenanganan cepat sangat baik ['ramahpenanganan', 'cepat', 'sangat', 'baik']
944 pelayananya baik stafnya ramah ['pelayananya', 'baik', 'stafnya', 'ramah']
945 pelayanan bagus walaupun menggunakan bpjs ['pelayanan', 'bagus', 'walaupun', 'menggunakan', 'bpjs']
946 pelayanan yang sangat memuaskan tempat yang bersih dan memadai ['pelayanan', 'yang', 'sangat', 'memuaskan', 'tempat', 'yang', 'bersih', 'dan', 'memadai']
947 layanan parkir sangat baik petugas parkir sangat membantu ['layanan', 'parkir', 'sangat', 'baik', 'petugas', 'parkir', 'sangat', 'membantu']
948 pelayanannya bagus dan ramah tempatnya skg bersih dan nyaman ['pelayanannya', 'bagus', 'dan', 'ramah', 'tempatnya', 'skg', 'bersih', 'dan', 'nyaman']
949 pelayanan baik perawat dan dokternya ramah ['pelayanan', 'baik', 'perawat', 'dan', 'dokternya', 'ramah']
950 pelayanan sangat memuaskan ['pelayanan', 'sangat', 'memuaskan']