Tokenizing Preprocessing

Tokenizing is the process of breaking down text into smaller units, called tokens, such as words, phrases, or symbols. This step is crucial for text analysis as it converts unstructured text into a structured format that can be easily processed and analyzed.

No Filtering (Stopwords) Tokenizing
751 pelayanan cukup baik petugasnya dan dokternya ramah ['pelayanan', 'cukup', 'baik', 'petugasnya', 'dan', 'dokternya', 'ramah']
752 dokter perawat dan staff ramah pelayanannya juga baik ['dokter', 'perawat', 'dan', 'staff', 'ramah', 'pelayanannya', 'juga', 'baik']
753 sangat puas periksa di rs X pelayanan oke keramahan oke penanganan oke ['sangat', 'puas', 'periksa', 'di', 'rs', 'queen', 'latifa', 'pelayanan', 'oke', 'keramahan', 'oke', 'penanganan', 'oke']
754 pelayanan baik dan memuaskan ['pelayanan', 'baik', 'dan', 'memuaskan']
755 pelayanannya oke banget pendaftaran ramahramah perawatnya gesit semoga jaya selalu ['pelayanannya', 'oke', 'banget', 'pendaftaran', 'ramahramah', 'perawatnya', 'gesit', 'semoga', 'jaya', 'selalu']
756 pelayanan poli sangat memuaskan ['pelayanan', 'poli', 'sangat', 'memuaskan']
757 sudah menunggu lama tidak di panggil padahal sudah tidak ada pasien lain akhirnya tinggal pulang saja tidak jadi periksa ['sudah', 'menunggu', 'lama', 'tidak', 'di', 'panggil', 'padahal', 'sudah', 'tidak', 'ada', 'pasien', 'lain', 'akhirnya', 'tinggal', 'pulang', 'saja', 'tidak', 'jadi', 'periksa']
758 antrian di rs ini tidak terlalu lama pelayanan memuaskan semoga semakin berkembang pesat rs X ['antrian', 'di', 'rs', 'ini', 'tidak', 'terlalu', 'lama', 'pelayanan', 'memuaskan', 'semoga', 'semakin', 'berkembang', 'pesat', 'rs', 'queen', 'latifa']
759 pelayanan baikgerak cepatbag pendaftaran ramah sangat membantu sekali ['pelayanan', 'baikgerak cepatbag', 'pendaftaran', 'ramah', 'sangat', 'membantu', 'sekali']
760 dokternya lebih enak yang dipuskesmas cukup sekali saja ke sini ['dokternya', 'lebih', 'enak', 'yang', 'dipuskesmas', 'cukup', 'sekali', 'saja', 'ke', 'sini']