Tokenizing Preprocessing

Tokenizing is the process of breaking down text into smaller units, called tokens, such as words, phrases, or symbols. This step is crucial for text analysis as it converts unstructured text into a structured format that can be easily processed and analyzed.

Filter by Location

No	Filtering (Stopwords)	Tokenizing
921	sangat baik pelayanan memuaskan	['sangat', 'baik', 'pelayanan', 'memuaskan']
922	perawat ramah rumah sakit bersih dan nyaman	['perawat', 'ramah', 'rumah', 'sakit', 'bersih', 'dan', 'nyaman']
923	pelayanan di rs X sangat memuaskan	['pelayanan', 'di', 'rs', 'queen', 'latifa', 'sangat', 'memuaskan']
924	perawatnya ramah ramah pelayanan tidak membingungkan terima kasih you	['perawatnya', 'ramah', 'ramah', 'pelayanan', 'tidak', 'membingungkan', 'terima', 'kasih', 'you']
925	pelayanan nya sangat memuaskan	['pelayanan', 'nya', 'sangat', 'memuaskan']
926	sudah bagus pertahankan yasemangat	['sudah', 'bagus', 'pertahankan', 'yasemangat']
927	rs X pelayananya sangat baik dan memuaskan tempat ruangan bersih	['rs', 'X', 'pelayananya', 'sangat', 'baik', 'dan', 'memuaskan', 'tempat', 'ruangan', 'bersih']
928	pelayanan rumah sakit cepat baik dan jelas	['pelayanan', 'rumah', 'sakit', 'cepat', 'baik', 'dan', 'jelas']
929	okelah	['okelah']
930	dulu waktu masih si jogjaaku juga kalau sakit kesinipelayanannya bagus	['dulu', 'waktu', 'masih', 'si', 'jogjaaku', 'juga', 'kalau', 'sakit', 'kesinipelayanannya', 'bagus']