Tokenizing Preprocessing

Tokenizing is the process of breaking down text into smaller units, called tokens, such as words, phrases, or symbols. This step is crucial for text analysis as it converts unstructured text into a structured format that can be easily processed and analyzed.

No Filtering (Stopwords) Tokenizing
921 sangat baik pelayanan memuaskan ['sangat', 'baik', 'pelayanan', 'memuaskan']
922 perawat ramah rumah sakit bersih dan nyaman ['perawat', 'ramah', 'rumah', 'sakit', 'bersih', 'dan', 'nyaman']
923 pelayanan di rs X sangat memuaskan ['pelayanan', 'di', 'rs', 'queen', 'latifa', 'sangat', 'memuaskan']
924 perawatnya ramah ramah pelayanan tidak membingungkan terima kasih you ['perawatnya', 'ramah', 'ramah', 'pelayanan', 'tidak', 'membingungkan', 'terima', 'kasih', 'you']
925 pelayanan nya sangat memuaskan ['pelayanan', 'nya', 'sangat', 'memuaskan']
926 sudah bagus pertahankan yasemangat ['sudah', 'bagus', 'pertahankan', 'yasemangat']
927 rs X pelayananya sangat baik dan memuaskan tempat ruangan bersih ['rs', 'X', 'pelayananya', 'sangat', 'baik', 'dan', 'memuaskan', 'tempat', 'ruangan', 'bersih']
928 pelayanan rumah sakit cepat baik dan jelas ['pelayanan', 'rumah', 'sakit', 'cepat', 'baik', 'dan', 'jelas']
929 okelah ['okelah']
930 dulu waktu masih si jogjaaku juga kalau sakit kesinipelayanannya bagus ['dulu', 'waktu', 'masih', 'si', 'jogjaaku', 'juga', 'kalau', 'sakit', 'kesinipelayanannya', 'bagus']