5 Alat yang sering digunakan untuk analisis data

    Ada banyak alat (tools) yang sering digunakan untuk menganalisa data. Data sendiri adalah kumpulan fakta yang bisa didapat dari berbagai sumber contohnya seperti sosial media. Pemanfaatan data yang tepat dapat dimanfaatkan menjadi sebuah informasi yang sangat berharga. Berikut adalah beberapa alat yang digunakan seorang analis dalam mengalisa data.

1.    Python

             Python adalah bahasa pemrograman yang berorientasi Objek untuk perangkat lunak dan pengembangan web dan kemudian ditingkatkan untuk bidang ilmu data. Python adalah bahasa pemrograman yang memiliki pertumbuhan paling cepat saat ini berdasarkan data dari Stack Overflow. Python dapat digunakan sebagai alat Analisis Data yang kuat karena memiliki kumpulan perpustakaan yang cukup lengkap untuk semua aspek komputasi ilmiah yang dibutuhkan. Python adalah bahasa pemrogtaman gratis atau open sources, dan mudah dipelajari. Pustaka analisis data Pandas dibangun di atas NumPy, yang merupakan pustaka yang digunakan untuk menganalisa data. Dengan Pandas dapat melakukan manipulasi data tingkat lanjut dan analisis numerik menggunakan bingkai data. Pandas mendukung banyak format file seperti format spreadsheet Excel maupun JSON (Javascript Object Notation). Sedangkan untuk memvisualisasikan pustaka yang digunakan adalah Matplotlib.


2.    R Language

            R adalah bahasa pemrograman terkemuka untuk pemodelan statistik, visualisasi, dan analisis data. Sebagian besar orang yang bekerja pada bidang statistika akan menggunakan bahasa pemrograman ini. R juga dapat digunakan untuk keperluan big data, dan pembelajaran mesin (machine learning). R adalah bahasa pemrograman open-source gratis dan memiliki banyak peningkatan dalam bentuk paket yang ditulis pengguna R memiliki kurva belajar yang curam dan membutuhkan sejumlah pengetahuan tentang pengkodean. Manipulasi data di R mudah dengan paket seperti plyr, dplyr, dan rapi. R sangat baik dalam hal visualisasi dan analisis data dengan paket seperti ggplot, lattice, ggvis, dll. R memiliki komunitas pengembang yang sangat besar untuk mendapatkan dukungan dan memiliki Pustaka yang sangat mendukung untuk analis data.

3.    Excel

              Excel adalah spreadsheet dan alat sederhana namun sangat kuat dan sigap untuk pengumpulan dan analisis data. Excel tidak memerlukan UI untuk memasukkan data karena pada tampilannya sendiri sangat familiar berbentuk baris dan kolom atau biasa disebut tabel. Alat ini digunakan secara luas dan mudah dipelajari dan mulai dalam analisis data. Bagan dan grafik di Excel memberikan interpretasi dan visualisasi yang jelas dari data Anda, yang membantu dalam pengambilan keputusan karena mudah dipahami. Sayangnya Excel tidaklah gratis seperti Python dan R karena membutuhkan langganan atau membeli lisensi ke Microsoft.

     4.    Tableau

 Tableau adalah alat BI (Business Intelligence) yang dikembangkan untuk analis data di mana seseorang dapat memvisualisasikan, menganalisis, dan memahami data mereka. Tableau bukan perangkat lunak gratis, dan harganya bervariasi sesuai kebutuhan data yang berbeda Sangat mudah untuk belajar dan menggunakan Tableau Untuk mengetahui dan mempelajari Tableau. Tableau menyediakan analitik cepat itu dapat menjelajahi semua jenis data – spreadsheet, database, data di Hadoop dan layanan cloud mudah digunakan karena memiliki fitur seret dan lepas yang kuat yang dapat ditangani oleh siapa saja yang memiliki pikiran intuitif. Visualisasi data dengan dasbor pintar dapat dibagikan dalam hitungan detik. Untuk dapat menggunakan alat ini untuk belajar dapat menggunakan Tableau public.

     5.    Apache Spark

                 Spark Adalah mesin analitik terintegrasi untuk pemrosesan Big Data yang dirancang untuk pengembang, peneliti, dan ilmuwan data. Alat ini gratis, dan berbagai pengembang berkontribusi untuk pengembangannya yang memiliki  kinerja tinggi dan berfungsi dengan baik untuk data batch dan streaming. Mempelajari Spark itu mudah, dan Anda dapat menggunakannya secara interaktif dari shell Scala, Python, R, dan SQL juga. Spark dapat berjalan di platform apa pun seperti Hadoop, Apache Mesos, standalone, atau di cloud yang dapat digunakan mengakses beragam sumber data. Spark termasuk perpustakaan seperti untuk SQL dan data terstruktur - Pembelajaran mesin SparkSQL - Pemrosesan aliran data langsung MLlib – SparkStreaming Analisis grafik - GraphX.

 

 

 

 


Komentar

Postingan populer dari blog ini

Pertanyaan mengenai Open Source

CHAPTER 18. TESTING CONVENTIONAL APPLICATION

Studi Kasus Open Source