Tokenizing Preprocessing

Tokenizing is the process of breaking down text into smaller units, called tokens, such as words, phrases, or symbols. This step is crucial for text analysis as it converts unstructured text into a structured format that can be easily processed and analyzed.

No Filtering (Stopwords) Tokenizing
961 pelayanannya sangat bagus tanggap sigap cepat ['pelayanannya', 'sangat', 'bagus', 'tanggap', 'sigap', 'cepat']
962 pelayanan cepat staff ramah ['pelayanan', 'cepat', 'staff', 'ramah']
963 rsu X pelayanan nya bagus perawat dan dokternya pun ramah ramah ['rsu', 'queen', 'latifa', 'pelayanan', 'nya', 'bagus', 'perawat', 'dan', 'dokternya', 'pun', 'ramah', 'ramah']
964 pelayan di farmasi sedikit lama ['pelayan', 'di', 'farmasi', 'sedikit', 'lama']
965 pelayanan cepat tanggap apalagi di igd nya ['pelayanan', 'cepat', 'tanggap', 'apalagi', 'di', 'igd', 'nya']
966 pelayanan parkir sangat bagus dan petugas parkir sangat membantu ['pelayanan', 'parkir', 'sangat', 'bagus', 'dan', 'petugas', 'parkir', 'sangat', 'membantu']
967 layanan depan ribet busuk ['layanan', 'depan', 'ribet', 'busuk']
968 pelayanany cepat dan kamar untuk rawat inap bersih ['pelayanany', 'cepat', 'dan', 'kamar', 'untuk', 'rawat', 'inap', 'bersih']
969 pelayanan farmasi nya lama ['pelayanan', 'farmasi', 'nya', 'lama']
970 rumah sakit X sangat bagus pelayananya ramahramah petugasnya pokoknya is the best ['rumah', 'sakit', 'queen', 'latifa', 'sangat', 'bagus', 'pelayananya', 'ramahramah', 'petugasnya', 'pokoknya', 'is', 'the', 'best']