R, Python atau SAS: Mana yang Duluan Dipelajari ?

Portal-Statstik, Hello gaees, kabar baik ya semuanya. R, Python atau SAS: Mana yang Duluan Dipelajari ? judul itu dahulu sempat terlintas dipikiran saya, sebenarnya tidak hanya ketiga aplikasi atau pemrograman itu masih sangat banyak jenis atau model bahasa pemrograman yang bisa dipelajari, namun yang kita bahas kali ini adalah bidang data science dan sejenisnya, seberapa perlu kita menyiapkan senjata untuk terjun ke dunia yang sesungguhnya, mengerjakan berbagai real case yang ada di lapangan.

Ya, bahasa pemrograman itu termasuk Top yang digunakan oleh seorang data scientist/data analyst. Nah, dalam tulisan kali ini saya akan mengupas sedikit mengenai hal ini, mana yang harus didahulukan, semoga dapat berguna buat teman-teman yang mungkin masih baru dan akan memulai memasuki bidang ini.

R, Python dan SAS adalah tiga software atau bahasa pemrograman yang paling populer dalam bidang Data Science. Jika anda sebagai orang baru dalam bidang Data Science dan belum memiliki banyak gambaran tentang dunia ini, maka kemungkinan anda akan cukup bingung mana yang harus didahulukan untuk dipelajari antara R, Python dan SAS.
Ok, jangan khawatir, baca sampai akhir, dan anda akan tau bahasa mana yang cocok untuk anda pelajari saat ini.


Sekilas tentang ketiga bahasa pemrograman ini.

R adalah bahasa pemrograman yang berbasis scripting dengan bantuan beberapa packages di dalamnya guna analisis statistika dan grafik mulai dari yang sederhana sampai tingkat lanjut. Perangkat lunak ini adalah Free dan Open Source, jadi anda bisa mengembangkannya sesuai dengan tujuan yang dikehendaki.

Python, hmm ini bahasa yang cukup asing bagi saya, belum pernah mendalami secara khusus, namun yang saya tahu dari teman-teman yang sering menggunakan Python, ini adalah bahasa yang manusiawi, bahasa pemrograman tingkat tinggi interpretatif multiguna. Tidak seperti bahasa lain yang susah untuk dibaca dan dipahami, python lebih menekankan pada keterbacaan kode agar lebih mudah untuk memahami sintaks. O ya ini adalah aplikasi yang Free dan Open Source juga.

SAS merupakan pemimpin software dan layanan Business Analytics, dan vendor independen terbesar dalam pasar Business Intelegence. Intinya SAS lebih banyak menangani bidang analisis untuk Big Data dengan beberapa varian aplikasinya yang hampir mencapai 300. Disinilah di PT SAS Institute saya melaksanakan magang dulu haha.

Jika anda akan memulai karir di bidang Data Science atau ada rencana untuk terjun kebidang ini, maka sebaiknya anda memikirkan bahasa mana yang sebaiknya anda pelajari terlebih dahulu. Apakah sebaiknya anda fokus menguasai untuk R, Python, ataukah SAS ?

Oke, Perhatikan beberapa faktor dibawah ini sebelum anda memutuskan untuk belajar apa duluan.

  • Industri  mana saja yang lebih banyak menggunakan Tools tersebut.
    Burtch Works pernah melakukan survei mengenai hal ini, mereka menanyakan kepada lebih dari 1000 orang responden profesional yang bekerja diberbagai bidang tentang bahasa pemrograman mana yang lebih mereka sukai/pilih antara R, SAS atau Python. Berikut ini hasilnya.
    SAS lebih dipilih atau disukai oleh perusahaan-perusahaan besar karena mereka menawarkan layanan yang memadai bagi mereka, SAS juga lebih dipilih oleh perusahaan-perusahaan dibidang jasa keuangan dan perusahaan marketing.
    R dan Python lebih digunakan oleh perusahaan-perusahaan menengah kebawah. R dan Python banyak digunakan oleh perusahaan-perusahaan sejenis Start up, perusahaan teknologi informasi dan komunikasi dan sejenisnya, karena perusahaan ini memiliki data dalam jumlah besar dan tidak terstruktur, sehingga para data scientist lebih memilih bahasa/perangkat lunak ini untuk melakukan analisis terhadap data mereka.

  • Biaya dan Kemudahan Belajar
    Ya sudah bukan rahasia lagi, SAS adalah sebuah perangkat lunak komersial dengan harga yang cukup mahal untuk membeli lisensi penggunaannya, SAS tentunya digunakan oleh perusahaan-perusahaan  besar  yang memiliki anggaran cukup besar.

    Sedangkan R dan Python adalah perangkat lunak yang Free dan Open Source, yang dapat di download, digunakan, dan dimodifikasi oleh siapapun.
    Untuk belajar SAS, mungkin anda tidak perlu banyak belajar/tahu bahasa-bahasa pemrograman lain, SAS sangat enak dan cukup mudah untuk dipelajari, apalagi ada SAS untuk versi GUI seperti SAS Enterprise Miner, hal ini membuat SAS paling mudah untuk dipelajari dibandingkan dengan ketiga bahasa/aplikasi ini.

    Sedangkan untuk melakukan analisis data dengan Python, kita juga bisa memanfaatkan library atau package yang ada, seperti Pandas, Numpy, Scpy dan lain sebagainya, dengan kata lain kita tidak bersentuhan langsung dengan keseluruhan kode-kode Python untuk melakukan analisis data. Hal ini mirip dengan script/kode yang biasa ditulis di R.

    Oleh karena itu banyak yang bilang bahwa, lebih mudah untuk belajar R ketika Anda sudah akrab dengan Python data mining libraries. Jika Anda sudah tahu R, maka Anda harus mempelajari dasar-dasar bahasa pemrograman Python sebelum Anda mulai mempelajari ekosistem Python.  Jadi, jangan berpikir bahwa R tu sulit, dan Python mudah untuk dibelajari !
  • Kemampuan Data Science
    SAS sangat efisien dalam akses data sekuensial, dan sudah terintegrasi dengan baik terhadap akses SQL database. Drag-and-drop interface membuatnya mudah untuk membuat model-model statistik yang lebih baik dan cepat. Memiliki kemampuan grafis yang fungsional, dan masih banyak lagi hal yang memudahkan pengguna dalam SAS.

    R dikenal dalam proses analis data pada server local, R adalah tool yang sangat baik untuk melakukan eksplorasi data. Saat ini R memiliki lebih dari 5000 packages / komunitas yang berkontribusi dalam CRAN. Beragam jenis packages/modules yang tersedia untuk statistik dan analisis data membuatnya menjadi bahasa yang populer dan powerfull dalam bidang data science. Membuat pemodelan statistik dapat ditulis dengan hanya beberapa baris kode saja. Kita bisa membuat grafik yang indah dan kompleks dengan hanya memanfaatkan packages seperti ggplot2, lattice, rCHarts, dan sebagainya.

    Library Python seperti Pandas, Numpy, Scipy dan Scikit membuatnya menjadi bahasa pemrograman kedua terpopuler dikalangan data scientist setelah R. Kita juga bisa membuat grafik yang indah dan dengan memanfaatkan library seperti Matlplotlib dan Seaborn. Python banyak digunakan oleh orang-orang yang mengembangkan machine learning, scraping, dan analisis data yang tidak beraturan.
  • Dukungan Komunitas
    SAS memiliki komunitas online  yang aktif dimoderatori langsung oleh manager komunitas, kita bisa mengajukan pertanyaan terkait SAS dan komunitas akan segera menjawabnya. Blog resmi SAS juga merupakan hal yang sangat penting dan membantu jika kita memiliki masalah dengan SAS.

    R memiliki setidaknya 125 kelompok pengguna aktif di seluruh dunia, jumlah anggota terus meningkat secara signifikan. Python memiliki setidaknya 1657 kelompok namun kelompok yang fokus pada Data jauh lebih sedikit dibandingkan dengan R.

    R dan Python memiliki dukungan komunitas online terbesar dari Stackover flow, mailing lists, user-contributed  dan dokumentasi. Sedangkan SAS tidak memiliki komunitas open source yang aktif sama sekali.
  • Pekerjaan
    SAS memiliki lebih dari 80.000 pelanggan di seluruh dunia, dan kebanyakan dari mereka adalah korporasi dengan anggaran besar. Analis di organisasi-organisasi ini menggunakan SAS dengan cepat dan efisien membentuk berbagai model statistik pada suatu set data.

    Disisi lain, R dan Python digunakan oleh perusahaan-perusahaan berjenis Startup atau teknologi, R lebih kearah analisis statistik, data mining, dsb.

    Sementara itu, saat ini sedang terjadi ledakan besar-besaran terhadap data, data terus berkembang dan bertambah banyak yang membuat beberapa aplikasi kewalahan dalam hal analisisnya, oleh sebab itu ada baiknya kita mempersiapkan diri dengan bahasa pemrograman R.

    Sedangkan untuk Python, digunakan oleh programer untuk data mining dengan menerapkan ilmu statistik, pengguna python dalam hal ini sering disebut sebagai Machine learning engineer,  Data engineer,  Big data architect.

Kesimpulan

Jika tujuan Anda adalah untuk menjadi  seorang business analytics professional dan berencana untuk bergabung dengan perusahaan startup, maka sebaiknya anda harus belajar R terlebih dahulu. 

Jika Anda ingin bergabung dengan Multi National Company, terutama perusahaan di sektor perbankan dan keuangan industri, maka sebaiknya mulai dengan SAS dan setelah merasa nyaman dengan SAS kemudian belajar R. 

Jika anda ingin menjadi seorang big data professional, maka sebaiknya anda belajar R atau Python terlebih dahulu. Hal ini tergantung pada latar belakang anda juga. Jika Anda berasal dari latar belakang statistik / matematika maka Anda sebaiknya belajar R terlebih dahulu dan Jika Anda memiliki latar belakang pemrograman/IT, maka Anda sebaiknya belajar Python terlebih dahulu.


Oke cukup, itu dulu yang dapat saya ceritakan, selamat weekend semuanya !
Have FUN !

0 Komentar untuk "R, Python atau SAS: Mana yang Duluan Dipelajari ?"

Silahkan tinggalkan komentar, kritik, maupun saran dari sobat blogger tentang apa yang sobat rasakan setelah mengunjungi blog ini.

Back To Top