Di post lalu kita perlihatkan bagaimana ChatGPT dengan mudah merubah data angka skala ke dalam teks. Mengubah data angka jenis pertanyaan skala ke dalam teks sering menjadi pilihan kami karena data teks dapat di-coding secara otomatis seperti halnya ketika meng-coding jawaban teks untuk jenis pertanyaan lain seperti multiple choice, checkboxes, atau open end.
Post kali ini khusus untuk menghilangkan label yang digunakan di form untuk skala maksimum (10=Sangat Ingin Rekomendasi).
Seperti contoh di post lalu, ketika satu model chatbox sudah jadi Anda tinggal mengcopy data di sheet survey data, paste ke chatbox, lalu paste kembali hasilnya ke sheet di survey data Anda tanpa perlu menuliskan prompt lagi.
Ketika kita men-download data survey untuk pertanyaan skala dari form Googleform, kita bisa mendapatkan dua jenis data yaitu angka dan teks. Data teks muncul karena teks ini berfungsi label yang digunakan untuk menerangkan angka skala di pertanyaan di form.
Untuk pengolahan datanya kita biasanya kita merubah dahulu seluruh data yang memiliki bagian teks ke dalam angka, bisa menggunakan find – replace di Excel.
Untuk program tabulasi yang dapat melakukan teks coding secara otomatis dan weighting terhadap data teks, merubah data angka di pertanyaan skala menjadi teks bisa menjadi pilihan yang lebih disukai karena prosesnya menjadi lebih mudah. Merubah angka menjadi teks ini bisa dilakukan dengan sangat efisien menggunakan AI, yang bila dilakukan dengan cara lain akan sangat merepotkan.
Berikut contoh untuk merubah data angka menjadi teks untuk pertanyaan Net Promoter Score.
Dari screenshot terlihat bahwa selain menghilangkan kata sambung ‘dan’, ChatGPT secara otomatis menambahkan tanda koma untuk memisahkan frasa-frasa penyusunnya.
Dari post ini ChatGPT sangat membantu untuk data cleaning teks :
Koreksi typo
Identifikasi frasa dan memisahkan tiap frasa menggunakan tanda koma
Memulai frasa baru menggunakan huruf kapital
Menghilangkan kata sambung antar frasa sehingga frasa menjadi lebih spesifik
sehingga program Excel kami dapat melakukan tabulasi individual frasa, menggabungkan frasa-frasa yang memiliki arti yang sama, dan membuat tabulasi gabungan frasanya.
Dari screenshot terlihat bahwa untuk setiap data teks, frasa-frasanya penyusunnya sudah dipisahkan dengan koma dan penulisan frasa baru sudah dimulai dengan huruf kapital sesuai dengan prompt yang diberikan. Dalam hanya satu langkah ChatGPT dapat merubah teks ke dalam format yang memungkinkan pembuatan tabulasi dari tiap frasa dengan tanda koma sebagai delimiter.
Paste data ini ke kolom jawaban di sheet data survey.
Untuk data selanjutnya Anda cukup mencopy raw data, paste ke chatbox, copy hasil ChatGPT lalu paste kembali ke ke kolom jawaban di sheet data survey.
Namun sebelumnya data teks ini terlihat masih membutuhkan satu perbaikan lagi, yaitu menghilangkan kata sambung / konjungsi ‘dan’ agar frasa bisa dipecah kembali sehingga tabulasi frasa lebih spesifik.
ChatGPT sering kami gunakan untuk untuk data cleaning teks pada pertanyaan jenis open end. Data cleaning ini ditujukan agar data-data teks memiliki format yang dapat dianalisa oleh program Excel untuk data tabulasi kami.
Format ini pada dasarnya sama dengan standar penulisan kalimat, bahwa dalam kalimat setiap frasa/item berbeda dipisahkan dengan menggunakan tanda koma. Tanda koma ini sentral karena program Excel ini menggunanan tanda koma sebagai delimiter untuk membuat tabulasi dari tiap frasa/item. Namun sering kali pada pertanyaan open-ended terjadi ketidaksesuaian, seperti tanda koma yang hilang atau penempatan tanda koma yang salah.
Proses data cleaning ini cukup sederhana:
Copy kolom jawaban dari sheet data survei (di mana setiap baris adalah jawaban dari setiap responden).
Paste data tersebut ke chatbox ChatGPT.
Beri Prompt
Lihat hasil
Fine tune Prompt
Ulangi sampai sesuai, mungkin tidak perlu sampai perfect 100%, sisa bisa lebih efektif dilakukan manual
Paste kembali hasil ChatGPT ke kolom di sheet data survey
Di bawah ini terdapat contoh data cleaning teks. Seperti di post lalu tentang data cleaning angka, kita hanya perlu membuat model chatbox yang memberi hasil yang diharapkan dengan sedikit sample data. Jika sudah ok, untuk data selanjutnya cukup mengulang proses tanpa perlu membuat prompt lagi.
Data ini berupa teks yang berisi frasa-frasa tanpa tanda koma, kita ingin meminta ChatGPT memisahkan tiap frasa dengan tanda koma dan memulai frasa baru dengan huruf kapital.
Ketika kita inputkan data baru tanpa prompt, ChatGPT biasanya akan langsung mengulang proses yang dilakukan sebelumnya, kecuali ketika ChatGPT melihat jenis datanya berbeda.
Dengan contoh beberapa langkah data cleaning seperti di post-post sebelum ini, kemudian jika sekarang kita inputkan data baru – tanpa prompt apapun – ChatGPT akan langsung mengulang seluruh proses tersebut dan mengeluarkan hasilnya seperti terlihat di screenshot.
Langkah-langkah data cleaning sebelum ini : merubah informasi teks jt/juta menjadi angka, menambah “000” pada angka yang hanya terdiri dari 3 digit, menyeragamkan penulisan angka ribuan, sekarang semuanya langsung dikerjakan sekaligus.
Jika kamu sering melakukan data cleaning atau hal lain yang serupa, kamu bisa membuat chatbox yang khusus melakukan yang kamu inginkan dan bisa digunakan kembali di lain waktu. Promptnya cukup sederhana dan straightforward seperti terlihat di contoh post. Beri title chatbox tersebut dan hanya digunakan untuk keperluan ini saja agar tinggal pakai saat diperlukan.
Catatan bahwa ChatGPT hasilnya tidak selalu seperti diharapkan dan memang harus selalu dicek. Kesalahan yang kadang muncul apabila data yang kita paste ke chatbox memiliki row kosong, hasil dari ChatGPT kadang bergeser baris nya, tetapi selain itu hasilnya sangat baik.
Beberapa kasus untuk pertanyaan budget ini responden tidak menuliskan tiga digit ribuan “000” karena menganggap jawaban yang ada sudah bisa dimengerti.
Prompt berikut meminta ChatGPT untuk menambahkan tiga digit “000” untuk data yang terdiri dari tiga digit angka.
Langkah ini mengakhiri seluruh rangkaian proses data cleaning untuk kasus ini, dan yang sangat mengesankan adalah bahwa ChatGPT bisa ‘dilatih’.
ChatGPT ternyata dapat mengingat setiap langkah yang dilakukan sebelumnya dan kemudian bisa mengulang seluruh langkah secara sekaligus. Sehingga untuk data-data selanjutnya kita hanya perlu menginputkan/paste data di chatbox tersebut dan ChatGPT akan secara otomatis memberikan hasil data cleaningnya, tanpa perlu prompt apapun, seperti terlihat Post 6
Karena kita akan meng-copy hasil data cleaning dari ChatGPT ke Excel, kita ingin untuk data-data yang menggunakan titik sebagai tanda separator ribuan, tanda titiknya dihilangkan, sehingga ketika di-paste Excel membaca data ini sebagai angka dan bukan text.
Prompt berikut meminta ChatGPT untuk menghilangkan titik sebagai separator ribuan.
Setelah proses ini selesai, data cleaning selanjutnya adalah menambah jumlah digit ribuan “000” untuk data yang jumlah digit kurang. Ada di Post 5.
Ketika melakukan data cleaning, ChatGPT sering menampilkan dua set data: data sebelum cleaning dan sesudah cleaning. Kita bisa meminta ChatGPT hanya menampilkan data final setelah proses cleaning tanpa menyertakan data asli sebelum cleaning, agar nanti cukup mem-paste hasilnya ke kolom data di Excel.
Setelah ini kita ingin menyamakan format penulisan angka dengan menghilangkan tanda titik sebagai pemisah ribuan.
Dari hasil ini terlihat bahwa meskipun prompt kita hanya meminta mengganti teks “jt” atau “juta” menjadi “000000”, dengan konteks bahwa hasil yang diinginkan dari proses ini berupa angka uang, pada kasus yang sesuai selain mengganti teks menjadi angka ChatGPT secara otomatis juga menghilangkan spasi kosong antara digit pertama dan enam digit berikutnya sehingga menjadi angka uang.
Data hasil proses ini adalah data sementara karena kita tidak perlu data asli hanya butuh data hasil konversi saja. Ada di post 3.