Tokenizing Preprocessing

Tokenizing is the process of breaking down text into smaller units, called tokens, such as words, phrases, or symbols. This step is crucial for text analysis as it converts unstructured text into a structured format that can be easily processed and analyzed.

No Filtering (Stopwords) Tokenizing
-519 pelayanan yang sangat bagus dan memuaskan ['pelayanan', 'yang', 'sangat', 'bagus', 'dan', 'memuaskan']
-518 ugd nya fast respons mudah pas pngurusan bpjs ['ugd', 'nya', 'fast', 'respons', 'mudah', 'pas', 'pngurusan', 'bpjs']
-517 rumah sakitnya bagus layanannya memuaskan ['rumah', 'sakitnya', 'bagus', 'layanannya', 'memuaskan']
-516 memuaskan berobat disini langsung sembuh ['memuaskan', 'berobat', 'disini', 'langsung', 'sembuh']
-515 rumah sakit umum tempatnya strategis pelayanannya juga ramah ['rumah', 'sakit', 'umum', 'tempatnya', 'strategis', 'pelayanannya', 'juga', 'ramah']
-514 pelayanan yang diberikan bagus sekali ['pelayanan', 'yang', 'diberikan', 'bagus', 'sekali']
-513 pelayanannya sangat bagus tanggap sigap cepat ['pelayanannya', 'sangat', 'bagus', 'tanggap', 'sigap', 'cepat']
-512 pelayanan cepat staff ramah ['pelayanan', 'cepat', 'staff', 'ramah']
-511 rsu X pelayanan nya bagus perawat dan dokternya pun ramah ramah ['rsu', 'queen', 'latifa', 'pelayanan', 'nya', 'bagus', 'perawat', 'dan', 'dokternya', 'pun', 'ramah', 'ramah']
-510 pelayan di farmasi sedikit lama ['pelayan', 'di', 'farmasi', 'sedikit', 'lama']