Oleh: Brandy
Ringkasan
- AI mempercepat analisis data untuk keputusan bisnis strategis, meningkatkan efisiensi, dan menemukan peluang profit.
- ChatGPT efektif untuk analisis data kompleks, visualisasi data, prediksi, dan memberikan rekomendasi yang dapat dilakukan.
- Prompt engineering dilakukan secara sistematis dengan menentukan Role, Task, Requirement, dan Instruction untuk menghasilkan hasil yang relevan dan akurat sesuai kebutuhan bisnis.
Sekilas tentang Analisis Data
Apa itu Analisis Data?
Analisis data adalah proses mengumpulkan, membersihkan, dan menginterpretasikan data untuk membantu dalam mengambil keputusan berbasis data.
Dalam konteks bisnis, analisis data digunakan untuk membuat keputusan strategis, meningkatkan efisiensi operasional, dan serta mengidentifikasi peluang baru yang dapat menguntungkan perusahaan.
Jenis-jenis Data
Data dapat dibedakan menjadi 2 jenis utama, yaitu:
- Data kuantitatif: Data numerik yang bisa diukur dan dikuantifikasi. Biasanya data ini disusun dalam format tertentu seperti baris dan kolom dalam tabel atau database (SQL) sehingga menjadi data terstruktur.
- Data kualitatif: Data non-numerik yang mendeskripsikan kualitas atau karakteristik tertentu. Data ini tergolong tidak terstruktur, karena tidak memiliki format dan struktur tertentu. Seringkali dalam bentuk gambar, video, dan dokumen.
Proses Analisis Data
Proses analisis data biasanya melibatkan beberapa langkah, yaitu:
- Data Cleaning: Pembersihan data dari kesalahan, duplikasi, atau data yang hilang. Tujuannya adalah untuk memastikan bahwa data yang akan dianalisis akurat dan konsisten.
- Data Exploration: Data dieksplorasi untuk menemukan pola atau hubungan yang mungkin tersembunyi. Teknik visualisasi seperti grafik atau diagram sering digunakan untuk membantu dalam memahami distribusi dan tren dalam data.
- Data Transformation: Data diubah ke dalam format yang sesuai untuk analisis lebih lanjut. Data dapat dinormalisasi, dikategorikan, atau diagregasi, tergantung pada kebutuhan analisis.
Dengan bantuan Generative AI, seluruh proses ini dapat dipercepat dan ditingkatkan presisi serta keakuratannya.
AI dapat membantu dalam membersihkan data secara otomatis, menemukan pola-pola yang kompleks, dan bahkan memberikan rekomendasi berdasarkan analisis yang dilakukan.
Analisis Data Menggunakan AI
Kapabilitas AI dalam menganalisis data
AI memiliki kemampuan untuk memproses dan menganalisis data dalam jumlah besar dengan cepat dan efisien.
Dengan algoritma Machine Learning, AI dapat mengidentifikasi pola, membuat prediksi, dan memberikan rekomendasi yang didasarkan pada data yang dianalisis.
Beberapa kapabilitas utama AI dalam menganalisis data, seperti:
- Text Summarization: Meringkas teks panjang menjadi versi yang lebih pendek dan ringkas, serta menyoroti informasi penting.
- Information Extraction: Mengekstrak informasi spesifik dari teks, seperti nama, tanggal, atau angka.
- Question Answering: Menjawab pertanyaan yang diajukan berdasarkan informasi yang tersedia dalam data.
- Text Classification: Mengklasifikasikan teks ke dalam kategori tertentu, seperti topik, sentimen, atau genre.
- Conversation: Dapat berinteraksi dalam percakapan natural dengan pengguna, seperti yang dilakukan chatbot.
- Code Generation: Menghasilkan kode pemrograman berdasarkan instruksi yang diberikan.
- Reasoning: Melakukan pemikiran logis untuk memecahkan masalah atau membuat keputusan berdasarkan data.
Perbandingan AI Tools untuk menganalisis data
Berikut adalah perbandingan beberapa tools AI populer yang dapat digunakan untuk analisis data:
- Sangat cocok untuk tugas-tugas kompleks
- Dapat mencari informasi online
- Memiliki kemampuan coding yang kuat
- Menyediakan fitur tabel dan grafik
- Mudah digunakan
- Tidak cocok untuk tugas-tugas kompleks
- Dapat mencari informasi online
- Kurang cocok untuk tugas-tugas coding
- Baik untuk tugas-tugas logis
- Token input terbatas
- Tidak dapat mencari informasi dari internet
- Memiliki kemampuan coding yang kuat
Metode Prompt Engineering
Prompt engineering adalah metode untuk merancang instruksi atau pertanyaan yang diberikan kepada AI agar dapat menghasilkan hasil yang relevan dan akurat berdasarkan konteks yang diberikan.
Terdapat 3 metode utama dalam prompt engineering:
1. Zero Shot: Menggunakan prompt tanpa memberikan contoh sebelumnya.
- Prompt: "Analyze the sentiment of this review: 'The product is amazing, but the delivery was late.'”
- Response: "Positive.”
2. Few Shot: Memberikan satu contoh sebagai referensi.
- Prompt: "Example: Review: 'The movie was fantastic, but the theater was too cold.' Sentiment: Mixed. Now, analyze the sentiment of this review: 'The product is amazing, but the delivery was late.'"
- Response: "Mixed."
3. Chain-of-Thought (CoT): Memberikan step-by-step agar analisis menjadi lebih terstruktur dan akurat.
- Prompt: "Analyze the sentiment of this review: 'The product is amazing, but the delivery was late.' First, identify the positive aspect: 'The product is amazing.' Next, identify the negative aspect: 'the delivery was late.' Considering both aspects, determine the overall sentiment."
- Response: "The review has both positive and negative elements: the product quality is praised, but the delivery is criticized. Therefore, the sentiment is mixed."
Berikut adalah contoh penggunaan prompt yang baik dan kurang baik.
Langkah-langkah Analisis Data Menggunakan AI untuk Berbagai Proses
Berikut ini adalah langkah-langkah analisis data menggunakan ChatGPT.
Step 1: Buat Kerangka Prompt
Mulai dari membuat kerangka prompt yang jelas dan terstruktur. Kerangka ini harus mencakup Role, Task, Requirement, dan Instruction yang akan dilakukan oleh AI.
Step 2: Tentukan Requirement Berdasarkan Proses
Requirement akan ditentukan berdasarkan proses analisis data yang spesifik.
Berikut adalah contoh prompt yang dapat digunakan untuk masing-masing proses:
- Data Cleaning, untuk menangani data yang hilang, outlier, menghapus duplikasi, dan memperbaiki ketidakkonsistenan dalam data.
Prompt Requirement:
- Check for and handle missing values and outliers
- Find best way to save the outliers or missing data
- Fix any errors or inconsistencies in the data
- Remove duplicates
- Check typos, and fix them.
- Check the timeline, the transaction record only for 2023
- Data Exploration, untuk mendeskripsikan dataset, meringkas perhitungan statistik, dan mengidentifikasi temuan dari statistik.
Prompt Requirement:
- Provide an overview of the dataset, including the number of observations, features, and data types
- Generate summary statistics for numerical and categorical features.
- Highlight any significant findings or interesting observations.
- Data Transformation, untuk normalisasi atau standarisasi data, konversi jenis data, dan agregasi data.
Prompt Requirement:
- Normalize or standardize numerical features as necessary.
- Aggregate data if needed (e.g., summing, averaging) to create new meaningful features.
- Perform feature engineering to create new variables that could enhance the analysis.
- Document any transformations applied to the data.
Step 3: Gabungkan Rincian Prompt
Langkah terakhir adalah menggabungkan setiap rincian prompt sesuai dengan kerangka yang telah dibuat.
Role:
Act as a skilled data analyst with 15 years of experience in data cleaning, exploration, and transformation.
Task:
Your job is to prepare data of transaction records from a coffee shop in New York City in 2023 for analysis by cleaning, exploring, and transforming it.
Requirement:
(Salin semua prompt yang telah dibuat sebelumnya)
Instruction:
Please do in this following steps:
- Begin by providing an overview of the dataset and its structure.
- Follow up with detailed steps and results of the data cleaning process.
- Present your data exploration findings and summary statistics.
- Conclude with the transformations performed and provide the final dataset ready for analysis.
- Give me download link for the clean formatted data in .csv format
Berikut adalah contoh prompt finalnya.
You are an expert data analyst with 15+ years of experience in FnB industry.
Analyze the provided dataset to uncover insights, identify trends, and generate actionable recommendations.
Requirements:
- Dataset Overview:
- Summarize dataset structure, key features, and context
- Identify data quality issues
- In-Depth Analysis:
- Identify main trends, patterns, and correlations
- Use appropriate statistical techniques
- Provide relevant visualizations
- Key Metrics and Statistics:
- Calculate and interpret important metrics and statistics
- Strategic Implications:
- Identify emerging trends and potential risks
- Suggest 3-5 content themes or topics based on insights
- Actionable Recommendations:
- Provide 3-5 clear, data-driven recommendations
- Include rationale, potential impact, and implementation considerations
Please do in this following steps:
- Approach analysis critically, challenging assumptions
- Consider both short-term tactics and long-term strategy
- Use clear language, explaining technical terms when necessary
- Serve the output for business stakeholder
- Conclude with a brief executive summary (max 300 words)
Dasar Visualisasi Data
Apa itu visualisasi data?
Visualisasi data adalah proses mengubah data menjadi representasi visual, seperti grafik atau peta, untuk memudahkan pemahaman dan interpretasi data.
Visualisasi yang efektif dapat membantu mengidentifikasi tren, pola, dan anomali dalam data.
Jenis-jenis Visualisasi Data
Berikut adalah beberapa jenis visualisasi data yang umum digunakan, masing-masing dengan tujuan dan aplikasinya sendiri.
- Bar/Column Chart
Tujuan: Membandingkan langsung nilai antara beberapa kategori.
Contoh: Jumlah penjualan untuk berbagai produk.
- Line Chart
Tujuan: Menunjukkan tren dari waktu ke waktu.
Contoh: Pendapatan bulanan selama satu tahun.
- Pie Chart
Tujuan: Menunjukkan proporsi bagian terhadap keseluruhan.
Contoh: Kontribusi penjualan dari berbagai kategori.
- Scatter Plot
Tujuan: Mengidentifikasi hubungan atau korelasi antara variabel.
Contoh: Hubungan antara pengeluaran iklan dan penjualan.
Data Visualization Library
Library visualisasi data di Python adalah tools penting untuk membuat grafik, diagram, dan representasi visual data lainnya.
Python menyediakan berbagai library seperti Matplotlib, Seaborn, dan Plotly yang memungkinkan kamu untuk membuat visualisasi data yang menarik dan informatif dengan mudah.
Langkah-langkah Visualisasi Data Menggunakan AI
Secara umum, langkah-langkah visualisasi data adalah sebagai berikut:
- Memahami Data, termasuk memahami jenis, sumber, serta kualitas data agar bisa menentukan cara terbaik dalam memvisualisasikannya dan menghindari kesalahan interpretasi.
- Tentukan Tujuan Visualisasi Data. Apakah mau menunjukkan tren, perbandingan, distribusi, atau hubungan antar variabel?
- Pilih Jenis Grafik yang Tepat. Misalnya, bar chart untuk membandingkan kategori, sementara line chart untuk menunjukkan tren dari waktu ke waktu.
- Sederhanakan Visualisasi. Visualisasi harus mudah dipahami. Hindari menambahkan elemen yang tidak perlu yang dapat mengalihkan perhatian dari informasi utama.
- Pastikan Akurasi Data. Pastikan data yang divisualisasikan sudah benar dan konsisten.
- Tambahkan Konteks berupa penjelasan singkat, anotasi, atau label yang menjelaskan apa yang sedang ditampilkan untuk membantu audiens memahami visualisasi dengan baik.
- Uji dan Iterasi untuk memastikan bahwa visualisasi tersebut efektif dan sesuai dengan tujuan.
Step 1: Buat Kerangka Prompt
Sama dengan langkah pertama menganalisis data dengan AI, visualisasi data dimulai dari membuat kerangka prompt yang jelas dan terstruktur. Kerangka ini harus mencakup Role, Task, Requirement, dan Instruction yang akan dilakukan oleh AI.
Step 2: Tentukan Requirement Berdasarkan Kriteria
Requirement akan ditentukan berdasarkan kriteria visualisasi data yang efektif.
Berikut adalah kriteria grafik yang efektif.
- Mudah Dipahami
Informasi utama dari chart harus bisa ditangkap dengan cepat tanpa perlu penjelasan tambahan yang rumit. - Gunakan Warna yang Efektif
Warna tidak hanya menambah estetika, tetapi juga bisa membantu membedakan berbagai elemen dalam grafik.
- Sederhana
Grafik yang terlalu rumit dan penuh dengan detail bisa membingungkan audiens. Jadi, fokus pada elemen-elemen penting dan buatlah grafik yang tidak terlalu padat.
- Pilih Jenis Chart yang Tepat
Jenis grafik yang tepat penting untuk memastikan data ditampilkan dengan cara yang paling informatif dan sesuai dengan tujuan analisis.
- Pastikan Data Akurat
Kesalahan dalam representasi data dapat mengarah pada interpretasi yang salah. Jadi, pastikan bahwa data yang divisualisasikan ditampilkan secara akurat dan tanpa kesalahan.
Berikut adalah contoh prompt yang dapat digunakan untuk Requirement:
- Anyone should be able to get the main idea quickly.
- Use a color scheme that is both visually appealing and accessible.
- Make the chart clean and not too busy.
- Pick the best kind of chart to show your data.
- Make sure the chart shows the data accurately without mistakes.
- Implement data visualization best practices.
Step 3: Tentukan Instruksi Sesuai Kriteria
- Tentukan Tujuan Visualisasi Data.
Misalnya, total penjualan berdasarkan hari dalam seminggu, total penjualan berdasarkan jam dalam sehari, distribusi penjualan berdasarkan kategori produk.
Prompt:
Analyze the dataset to identify the main story or insights it conveys:
- Total sales by day of the week.
- Total sales by hour of the day.
- Sales distribution by product category.
- Pilih Jenis Chart yang Tepat
Misalnya:
- Bar chart untuk total penjualan berdasarkan hari dalam seminggu
- Line chart untuk total penjualan berdasarkan jam dalam sehari
- Pie chart untuk distribusi penjualan berdasarkan kategori produk.
Prompt:
Choose appropriate chart types that best represent the data and its relationships:
- A bar chart for total sales by day of the week.
- A line chart for total sales by hour of the day.
- A pie chart for sales distribution by product category. Grouping values that have small proportion and set as ‘Others’
- Sederhana
Misalnya, menggunakan palet warna yang kontras dan white space.
Prompt:
Design the visualization using a harmonious color palette, ensuring sufficient contrast for readability:
- Select a color palette that is both visually appealing and accessible (consider color blindness accessibility).
Use white space effectively to avoid clutter:
- Ensure there is enough space between different elements of the visualization to keep it clean and readable.
- Pastikan Data Akurat
Misalnya, gunakan skala yang sesuai, pastikan visualisasi secara akurat merepresentasikan data tanpa distorsi.
Prompt:
Use appropriate scales and maintain correct proportions:
- Ensure the scales used in the visualization are appropriate for the data.
- Maintain correct proportions to accurately represent the data.
- Tambahkan Konteks
Pastikan judul dan label jelas, soroti pesan penting, gunakan legenda jika ada beberapa seri data.
Prompt:
Label axes clearly and include a descriptive title:
- Ensure all axes have clear labels.
- The title should describe what the visualization represents.
Consider adding brief annotations to highlight key points:
- Use annotations to draw attention to significant trends or insights.
Include a legend if multiple data series are present:
- If the chart includes multiple data series, provide a clear and concise legend.
- Uji dan Iterasi
Uji hasil akhir untuk memastikan visualisasi secara akurat merepresentasikan data tanpa distorsi. Lakukan eksperimen menggunakan library untuk meningkatkan gaya visualisasi (opsional).
Prompt:
Review the final product to confirm it accurately represents the data without distortion:
- Verify that the visualization accurately represents the data and that there is no misrepresentation or distortion of the data.
Berikut adalah contoh prompt finalnya.
You are an expert data visualization designer with a keen eye for aesthetics and a deep understanding of data representation best practices.
Create a data visualization one by one based on the provided dataset that effectively communicates the key insights and trends.
Requirements:
- Anyone should be able to get the main idea quickly.
- Use a color scheme that is both visually appealing and accessible.
- Make the chart clean and not too busy.
- Pick the best kind of chart to show your data.
- Make sure the chart shows the data accurately without mistakes.
- Implement data visualization best practices.
Please do in this following steps:
- Analyze the dataset to identify the main story or insights it conveys:
- Total sales by day of the week.
- Total sales by hour of the day.
- Sales distribution by product category.
- Choose appropriate chart types that best represent the data and its relationships:
- A bar chart for total sales by day of the week.
- A line chart for total sales by hour of the day.
- A pie chart for sales distribution by product category. Grouping values that have small proportion and set as ‘Others’
- Design the visualization using a harmonious color palette, ensuring sufficient contrast for readability:
- Select a color palette that is both visually appealing and accessible (consider color blindness accessibility).
- Use white space effectively to avoid clutter:
- Ensure there is enough space between different elements of the visualization to keep it clean and readable.
- Use appropriate scales and maintain correct proportions:
- Ensure the scales used in the visualization are appropriate for the data.
- Maintain correct proportions to accurately represent the data.
- Label axes clearly and include a descriptive title:
- Ensure all axes have clear labels.
- The title should describe what the visualization represents.
- Consider adding brief annotations to highlight key points:
- Use annotations to draw attention to significant trends or insights.
- Include a legend if multiple data series are present:
- If the chart includes multiple data series, provide a clear and concise legend.
- Review the final product to confirm it accurately represents the data without distortion:
- Verify that the visualization accurately represents the data and that there is no misrepresentation or distortion of the data.
Dari prompt tersebut, akan menghasilkan visualisasi data seperti berikut.
Kesimpulan
Dalam dunia bisnis, kemampuan untuk menganalisis dan memvisualisasikan data dengan bantuan AI dapat mempercepat proses pengambilan keputusan secara lebih tepat dan efektif.
Jika kamu dan tim ingin belajar cara menganalisis dan memvisualisasikan data menggunakan AI, RevoU memiliki pelatihan AI yang dapat membantumu!
Cek silabus dan booking konsultasi di AI Corporate Training!
Oleh: Brandy
Ringkasan
- AI mempercepat analisis data untuk keputusan bisnis strategis, meningkatkan efisiensi, dan menemukan peluang profit.
- ChatGPT efektif untuk analisis data kompleks, visualisasi data, prediksi, dan memberikan rekomendasi yang dapat dilakukan.
- Prompt engineering dilakukan secara sistematis dengan menentukan Role, Task, Requirement, dan Instruction untuk menghasilkan hasil yang relevan dan akurat sesuai kebutuhan bisnis.
Sekilas tentang Analisis Data
Apa itu Analisis Data?
Analisis data adalah proses mengumpulkan, membersihkan, dan menginterpretasikan data untuk membantu dalam mengambil keputusan berbasis data.
Dalam konteks bisnis, analisis data digunakan untuk membuat keputusan strategis, meningkatkan efisiensi operasional, dan serta mengidentifikasi peluang baru yang dapat menguntungkan perusahaan.
Jenis-jenis Data
Data dapat dibedakan menjadi 2 jenis utama, yaitu:
- Data kuantitatif: Data numerik yang bisa diukur dan dikuantifikasi. Biasanya data ini disusun dalam format tertentu seperti baris dan kolom dalam tabel atau database (SQL) sehingga menjadi data terstruktur.
- Data kualitatif: Data non-numerik yang mendeskripsikan kualitas atau karakteristik tertentu. Data ini tergolong tidak terstruktur, karena tidak memiliki format dan struktur tertentu. Seringkali dalam bentuk gambar, video, dan dokumen.
Proses Analisis Data
Proses analisis data biasanya melibatkan beberapa langkah, yaitu:
- Data Cleaning: Pembersihan data dari kesalahan, duplikasi, atau data yang hilang. Tujuannya adalah untuk memastikan bahwa data yang akan dianalisis akurat dan konsisten.
- Data Exploration: Data dieksplorasi untuk menemukan pola atau hubungan yang mungkin tersembunyi. Teknik visualisasi seperti grafik atau diagram sering digunakan untuk membantu dalam memahami distribusi dan tren dalam data.
- Data Transformation: Data diubah ke dalam format yang sesuai untuk analisis lebih lanjut. Data dapat dinormalisasi, dikategorikan, atau diagregasi, tergantung pada kebutuhan analisis.
Dengan bantuan Generative AI, seluruh proses ini dapat dipercepat dan ditingkatkan presisi serta keakuratannya.
AI dapat membantu dalam membersihkan data secara otomatis, menemukan pola-pola yang kompleks, dan bahkan memberikan rekomendasi berdasarkan analisis yang dilakukan.
Analisis Data Menggunakan AI
Kapabilitas AI dalam menganalisis data
AI memiliki kemampuan untuk memproses dan menganalisis data dalam jumlah besar dengan cepat dan efisien.
Dengan algoritma Machine Learning, AI dapat mengidentifikasi pola, membuat prediksi, dan memberikan rekomendasi yang didasarkan pada data yang dianalisis.
Beberapa kapabilitas utama AI dalam menganalisis data, seperti:
- Text Summarization: Meringkas teks panjang menjadi versi yang lebih pendek dan ringkas, serta menyoroti informasi penting.
- Information Extraction: Mengekstrak informasi spesifik dari teks, seperti nama, tanggal, atau angka.
- Question Answering: Menjawab pertanyaan yang diajukan berdasarkan informasi yang tersedia dalam data.
- Text Classification: Mengklasifikasikan teks ke dalam kategori tertentu, seperti topik, sentimen, atau genre.
- Conversation: Dapat berinteraksi dalam percakapan natural dengan pengguna, seperti yang dilakukan chatbot.
- Code Generation: Menghasilkan kode pemrograman berdasarkan instruksi yang diberikan.
- Reasoning: Melakukan pemikiran logis untuk memecahkan masalah atau membuat keputusan berdasarkan data.
Perbandingan AI Tools untuk menganalisis data
Berikut adalah perbandingan beberapa tools AI populer yang dapat digunakan untuk analisis data:
- Sangat cocok untuk tugas-tugas kompleks
- Dapat mencari informasi online
- Memiliki kemampuan coding yang kuat
- Menyediakan fitur tabel dan grafik
- Mudah digunakan
- Tidak cocok untuk tugas-tugas kompleks
- Dapat mencari informasi online
- Kurang cocok untuk tugas-tugas coding
- Baik untuk tugas-tugas logis
- Token input terbatas
- Tidak dapat mencari informasi dari internet
- Memiliki kemampuan coding yang kuat
Metode Prompt Engineering
Prompt engineering adalah metode untuk merancang instruksi atau pertanyaan yang diberikan kepada AI agar dapat menghasilkan hasil yang relevan dan akurat berdasarkan konteks yang diberikan.
Terdapat 3 metode utama dalam prompt engineering:
1. Zero Shot: Menggunakan prompt tanpa memberikan contoh sebelumnya.
- Prompt: "Analyze the sentiment of this review: 'The product is amazing, but the delivery was late.'”
- Response: "Positive.”
2. Few Shot: Memberikan satu contoh sebagai referensi.
- Prompt: "Example: Review: 'The movie was fantastic, but the theater was too cold.' Sentiment: Mixed. Now, analyze the sentiment of this review: 'The product is amazing, but the delivery was late.'"
- Response: "Mixed."
3. Chain-of-Thought (CoT): Memberikan step-by-step agar analisis menjadi lebih terstruktur dan akurat.
- Prompt: "Analyze the sentiment of this review: 'The product is amazing, but the delivery was late.' First, identify the positive aspect: 'The product is amazing.' Next, identify the negative aspect: 'the delivery was late.' Considering both aspects, determine the overall sentiment."
- Response: "The review has both positive and negative elements: the product quality is praised, but the delivery is criticized. Therefore, the sentiment is mixed."
Berikut adalah contoh penggunaan prompt yang baik dan kurang baik.
Langkah-langkah Analisis Data Menggunakan AI untuk Berbagai Proses
Berikut ini adalah langkah-langkah analisis data menggunakan ChatGPT.
Step 1: Buat Kerangka Prompt
Mulai dari membuat kerangka prompt yang jelas dan terstruktur. Kerangka ini harus mencakup Role, Task, Requirement, dan Instruction yang akan dilakukan oleh AI.
Step 2: Tentukan Requirement Berdasarkan Proses
Requirement akan ditentukan berdasarkan proses analisis data yang spesifik.
Berikut adalah contoh prompt yang dapat digunakan untuk masing-masing proses:
- Data Cleaning, untuk menangani data yang hilang, outlier, menghapus duplikasi, dan memperbaiki ketidakkonsistenan dalam data.
Prompt Requirement:
- Check for and handle missing values and outliers
- Find best way to save the outliers or missing data
- Fix any errors or inconsistencies in the data
- Remove duplicates
- Check typos, and fix them.
- Check the timeline, the transaction record only for 2023
- Data Exploration, untuk mendeskripsikan dataset, meringkas perhitungan statistik, dan mengidentifikasi temuan dari statistik.
Prompt Requirement:
- Provide an overview of the dataset, including the number of observations, features, and data types
- Generate summary statistics for numerical and categorical features.
- Highlight any significant findings or interesting observations.
- Data Transformation, untuk normalisasi atau standarisasi data, konversi jenis data, dan agregasi data.
Prompt Requirement:
- Normalize or standardize numerical features as necessary.
- Aggregate data if needed (e.g., summing, averaging) to create new meaningful features.
- Perform feature engineering to create new variables that could enhance the analysis.
- Document any transformations applied to the data.
Step 3: Gabungkan Rincian Prompt
Langkah terakhir adalah menggabungkan setiap rincian prompt sesuai dengan kerangka yang telah dibuat.
Role:
Act as a skilled data analyst with 15 years of experience in data cleaning, exploration, and transformation.
Task:
Your job is to prepare data of transaction records from a coffee shop in New York City in 2023 for analysis by cleaning, exploring, and transforming it.
Requirement:
(Salin semua prompt yang telah dibuat sebelumnya)
Instruction:
Please do in this following steps:
- Begin by providing an overview of the dataset and its structure.
- Follow up with detailed steps and results of the data cleaning process.
- Present your data exploration findings and summary statistics.
- Conclude with the transformations performed and provide the final dataset ready for analysis.
- Give me download link for the clean formatted data in .csv format
Berikut adalah contoh prompt finalnya.
You are an expert data analyst with 15+ years of experience in FnB industry.
Analyze the provided dataset to uncover insights, identify trends, and generate actionable recommendations.
Requirements:
- Dataset Overview:
- Summarize dataset structure, key features, and context
- Identify data quality issues
- In-Depth Analysis:
- Identify main trends, patterns, and correlations
- Use appropriate statistical techniques
- Provide relevant visualizations
- Key Metrics and Statistics:
- Calculate and interpret important metrics and statistics
- Strategic Implications:
- Identify emerging trends and potential risks
- Suggest 3-5 content themes or topics based on insights
- Actionable Recommendations:
- Provide 3-5 clear, data-driven recommendations
- Include rationale, potential impact, and implementation considerations
Please do in this following steps:
- Approach analysis critically, challenging assumptions
- Consider both short-term tactics and long-term strategy
- Use clear language, explaining technical terms when necessary
- Serve the output for business stakeholder
- Conclude with a brief executive summary (max 300 words)
Dasar Visualisasi Data
Apa itu visualisasi data?
Visualisasi data adalah proses mengubah data menjadi representasi visual, seperti grafik atau peta, untuk memudahkan pemahaman dan interpretasi data.
Visualisasi yang efektif dapat membantu mengidentifikasi tren, pola, dan anomali dalam data.
Jenis-jenis Visualisasi Data
Berikut adalah beberapa jenis visualisasi data yang umum digunakan, masing-masing dengan tujuan dan aplikasinya sendiri.
- Bar/Column Chart
Tujuan: Membandingkan langsung nilai antara beberapa kategori.
Contoh: Jumlah penjualan untuk berbagai produk.
- Line Chart
Tujuan: Menunjukkan tren dari waktu ke waktu.
Contoh: Pendapatan bulanan selama satu tahun.
- Pie Chart
Tujuan: Menunjukkan proporsi bagian terhadap keseluruhan.
Contoh: Kontribusi penjualan dari berbagai kategori.
- Scatter Plot
Tujuan: Mengidentifikasi hubungan atau korelasi antara variabel.
Contoh: Hubungan antara pengeluaran iklan dan penjualan.
Data Visualization Library
Library visualisasi data di Python adalah tools penting untuk membuat grafik, diagram, dan representasi visual data lainnya.
Python menyediakan berbagai library seperti Matplotlib, Seaborn, dan Plotly yang memungkinkan kamu untuk membuat visualisasi data yang menarik dan informatif dengan mudah.
Langkah-langkah Visualisasi Data Menggunakan AI
Secara umum, langkah-langkah visualisasi data adalah sebagai berikut:
- Memahami Data, termasuk memahami jenis, sumber, serta kualitas data agar bisa menentukan cara terbaik dalam memvisualisasikannya dan menghindari kesalahan interpretasi.
- Tentukan Tujuan Visualisasi Data. Apakah mau menunjukkan tren, perbandingan, distribusi, atau hubungan antar variabel?
- Pilih Jenis Grafik yang Tepat. Misalnya, bar chart untuk membandingkan kategori, sementara line chart untuk menunjukkan tren dari waktu ke waktu.
- Sederhanakan Visualisasi. Visualisasi harus mudah dipahami. Hindari menambahkan elemen yang tidak perlu yang dapat mengalihkan perhatian dari informasi utama.
- Pastikan Akurasi Data. Pastikan data yang divisualisasikan sudah benar dan konsisten.
- Tambahkan Konteks berupa penjelasan singkat, anotasi, atau label yang menjelaskan apa yang sedang ditampilkan untuk membantu audiens memahami visualisasi dengan baik.
- Uji dan Iterasi untuk memastikan bahwa visualisasi tersebut efektif dan sesuai dengan tujuan.
Step 1: Buat Kerangka Prompt
Sama dengan langkah pertama menganalisis data dengan AI, visualisasi data dimulai dari membuat kerangka prompt yang jelas dan terstruktur. Kerangka ini harus mencakup Role, Task, Requirement, dan Instruction yang akan dilakukan oleh AI.
Step 2: Tentukan Requirement Berdasarkan Kriteria
Requirement akan ditentukan berdasarkan kriteria visualisasi data yang efektif.
Berikut adalah kriteria grafik yang efektif.
- Mudah Dipahami
Informasi utama dari chart harus bisa ditangkap dengan cepat tanpa perlu penjelasan tambahan yang rumit. - Gunakan Warna yang Efektif
Warna tidak hanya menambah estetika, tetapi juga bisa membantu membedakan berbagai elemen dalam grafik.
- Sederhana
Grafik yang terlalu rumit dan penuh dengan detail bisa membingungkan audiens. Jadi, fokus pada elemen-elemen penting dan buatlah grafik yang tidak terlalu padat.
- Pilih Jenis Chart yang Tepat
Jenis grafik yang tepat penting untuk memastikan data ditampilkan dengan cara yang paling informatif dan sesuai dengan tujuan analisis.
- Pastikan Data Akurat
Kesalahan dalam representasi data dapat mengarah pada interpretasi yang salah. Jadi, pastikan bahwa data yang divisualisasikan ditampilkan secara akurat dan tanpa kesalahan.
Berikut adalah contoh prompt yang dapat digunakan untuk Requirement:
- Anyone should be able to get the main idea quickly.
- Use a color scheme that is both visually appealing and accessible.
- Make the chart clean and not too busy.
- Pick the best kind of chart to show your data.
- Make sure the chart shows the data accurately without mistakes.
- Implement data visualization best practices.
Step 3: Tentukan Instruksi Sesuai Kriteria
- Tentukan Tujuan Visualisasi Data.
Misalnya, total penjualan berdasarkan hari dalam seminggu, total penjualan berdasarkan jam dalam sehari, distribusi penjualan berdasarkan kategori produk.
Prompt:
Analyze the dataset to identify the main story or insights it conveys:
- Total sales by day of the week.
- Total sales by hour of the day.
- Sales distribution by product category.
- Pilih Jenis Chart yang Tepat
Misalnya:
- Bar chart untuk total penjualan berdasarkan hari dalam seminggu
- Line chart untuk total penjualan berdasarkan jam dalam sehari
- Pie chart untuk distribusi penjualan berdasarkan kategori produk.
Prompt:
Choose appropriate chart types that best represent the data and its relationships:
- A bar chart for total sales by day of the week.
- A line chart for total sales by hour of the day.
- A pie chart for sales distribution by product category. Grouping values that have small proportion and set as ‘Others’
- Sederhana
Misalnya, menggunakan palet warna yang kontras dan white space.
Prompt:
Design the visualization using a harmonious color palette, ensuring sufficient contrast for readability:
- Select a color palette that is both visually appealing and accessible (consider color blindness accessibility).
Use white space effectively to avoid clutter:
- Ensure there is enough space between different elements of the visualization to keep it clean and readable.
- Pastikan Data Akurat
Misalnya, gunakan skala yang sesuai, pastikan visualisasi secara akurat merepresentasikan data tanpa distorsi.
Prompt:
Use appropriate scales and maintain correct proportions:
- Ensure the scales used in the visualization are appropriate for the data.
- Maintain correct proportions to accurately represent the data.
- Tambahkan Konteks
Pastikan judul dan label jelas, soroti pesan penting, gunakan legenda jika ada beberapa seri data.
Prompt:
Label axes clearly and include a descriptive title:
- Ensure all axes have clear labels.
- The title should describe what the visualization represents.
Consider adding brief annotations to highlight key points:
- Use annotations to draw attention to significant trends or insights.
Include a legend if multiple data series are present:
- If the chart includes multiple data series, provide a clear and concise legend.
- Uji dan Iterasi
Uji hasil akhir untuk memastikan visualisasi secara akurat merepresentasikan data tanpa distorsi. Lakukan eksperimen menggunakan library untuk meningkatkan gaya visualisasi (opsional).
Prompt:
Review the final product to confirm it accurately represents the data without distortion:
- Verify that the visualization accurately represents the data and that there is no misrepresentation or distortion of the data.
Berikut adalah contoh prompt finalnya.
You are an expert data visualization designer with a keen eye for aesthetics and a deep understanding of data representation best practices.
Create a data visualization one by one based on the provided dataset that effectively communicates the key insights and trends.
Requirements:
- Anyone should be able to get the main idea quickly.
- Use a color scheme that is both visually appealing and accessible.
- Make the chart clean and not too busy.
- Pick the best kind of chart to show your data.
- Make sure the chart shows the data accurately without mistakes.
- Implement data visualization best practices.
Please do in this following steps:
- Analyze the dataset to identify the main story or insights it conveys:
- Total sales by day of the week.
- Total sales by hour of the day.
- Sales distribution by product category.
- Choose appropriate chart types that best represent the data and its relationships:
- A bar chart for total sales by day of the week.
- A line chart for total sales by hour of the day.
- A pie chart for sales distribution by product category. Grouping values that have small proportion and set as ‘Others’
- Design the visualization using a harmonious color palette, ensuring sufficient contrast for readability:
- Select a color palette that is both visually appealing and accessible (consider color blindness accessibility).
- Use white space effectively to avoid clutter:
- Ensure there is enough space between different elements of the visualization to keep it clean and readable.
- Use appropriate scales and maintain correct proportions:
- Ensure the scales used in the visualization are appropriate for the data.
- Maintain correct proportions to accurately represent the data.
- Label axes clearly and include a descriptive title:
- Ensure all axes have clear labels.
- The title should describe what the visualization represents.
- Consider adding brief annotations to highlight key points:
- Use annotations to draw attention to significant trends or insights.
- Include a legend if multiple data series are present:
- If the chart includes multiple data series, provide a clear and concise legend.
- Review the final product to confirm it accurately represents the data without distortion:
- Verify that the visualization accurately represents the data and that there is no misrepresentation or distortion of the data.
Dari prompt tersebut, akan menghasilkan visualisasi data seperti berikut.
Kesimpulan
Dalam dunia bisnis, kemampuan untuk menganalisis dan memvisualisasikan data dengan bantuan AI dapat mempercepat proses pengambilan keputusan secara lebih tepat dan efektif.
Jika kamu dan tim ingin belajar cara menganalisis dan memvisualisasikan data menggunakan AI, RevoU memiliki pelatihan AI yang dapat membantumu!
Cek silabus dan booking konsultasi di AI Corporate Training!
Enter Your Details Below to Get Access
More posts
Siap meningkatkan skill tim Anda dengan Corporate Training?
Di RevoU, tim anda akan belajar secara interaktif bersama instruktur ahli, dengan metode 70% praktik, 20% mentoring, dan 10% teori. Miliki kebebasan memilih program, durasi, dan lokasi sesuai dengan kebutuhan perusahaan Anda.
Konsultasi Sekarang