Apakah ilmuwan data menjauh dari Jupyter Notebooks?

Fernando Perez dan Brian Granger meluncurkan proyek Jupiter ethon Pada tahun 2014. Nama Jupiter Itu mengacu pada tiga bahasa pemrograman utama yang didukung oleh Jupyter, yaitu Julia, Python dan R dan juga merupakan penghormatan kepada buku catatan yang ditulis Galileo ketika ia menemukan bulan-bulan Jupiter. Segera setelah dirilis, a github Analisis menunjukkan bahwa lebih dari 2,5 juta tahun buku catatan Jupiter Itu digunakan pada September 2018. Bagi para ilmuwan data, Jupyter telah menjadi lingkungan utama dan sering kali menjadi alat pertama yang ditawarkan dalam kursus ilmu data. Ini adalah cara yang bagus untuk menampilkan karya pengguna karena kode dan hasilnya dapat dilihat bersebelahan. Ini juga dirancang untuk dengan mudah berbagi ide dengan rekan kerja. Tetapi bahkan ketika para ilmuwan data semakin mengandalkan Notebook Jupyter, para peneliti tetap berhati-hati dengan kekurangan mereka.

Struktur Dasar Notebook Jupyter, Sumber: Jupyter

Pada tahun 2018, peneliti menghubungi Joel Grossyang bekerja dengan Institut Allen untuk Kecerdasan Buatan, mempresentasikan argumennya terhadap Jupyter Notebooks berjudul “Saya tidak suka laptop” di Jupyter Developers Conference. Sementara Grus mengakui bahwa itu mudah digunakan dan efektif dalam analisis data eksplorasi, itu juga salah dalam kode. Dia mengatakan notebook ini mendorong kebiasaan pengkodean yang buruk di antara para ilmuwan data. Pengguna tidak menjalankan kode dalam sel dalam urutan yang ditentukan dan akhirnya menjadi frustrasi.

penataan kode

Dalam beberapa hal, Jupyter Notebooks mempersulit ilmuwan data untuk berkolaborasi saat coding. Ketika kode ditulis dalam sel daripada fungsi, kelas atau objek, pengguna berakhir dengan kode duplikat, yang menjadi membingungkan dan sulit untuk dipelihara di Jupyter. Karena pemrogram biasanya menyalin potongan kode satu sama lain, itu bisa menjadi tidak sinkron dengan sangat cepat. Duplikasi kode juga berarti sulit untuk tetap berpegang pada satu versi jawaban atau salah satunya buku catatan Solusi terbaik harus berupa angka xyz. Selain itu, mereka juga membuat plot berbagi di luar tim ilmu data menjadi lebih ketat. Karena membuat data penting dapat diakses di organisasi besar berisiko, plot umumnya dibagikan secara eksternal melalui salin dan tempel saat data berubah, yang tidak praktis.

READ  WhatsApp akan segera membiarkan Anda menyembunyikan status 'terakhir terlihat' dari kontak tertentu

Tidak cocok untuk produksi

Notebook Jupyter terbukti tidak efektif setelah ilmuwan data memindahkan eksplorasi data masa lalu ke produksi aktual. Untuk membangun jalur data yang serius, sangat penting untuk memiliki struktur kode yang baik sehingga ada pengembangan yang didorong oleh pengujian. Produksi membutuhkan pengalaman mereproduksi berulang-ulang dan menjalankan notebook, dan Notebook Jupyter sering tidak dirancang. Notebook Jupyter memiliki alur kerja non-linear, membuatnya lebih interaktif di satu sisi sehingga pengguna dapat beralih antara pengkodean dan notebook. Di sisi lain, itu juga menyebabkan hasil yang jarang, yang menyebabkan lebih banyak rintangan dalam tahap produksi.

masalah keamanan

Baru-baru ini, masalah keamanan yang lebih serius telah muncul. Pada bulan Maret tahun ini, tim Nautilus Aqua Security menemukan ransomware berbasis Python yang menggunakan Jupyter Notebooks untuk mengakses dan menargetkan lingkungan lain. Dan sementara belum ada konfirmasi, para peneliti percaya sumber serangan itu adalah Rusia. Sebuah laporan oleh Aqua Security menyatakan bahwa karena Notebook Jupyter terutama digunakan oleh ilmuwan data perusahaan untuk menganalisis data dan membangun model data, mereka rentan terhadap pelanggaran keamanan.

Alternatif yang lebih baik

Tahun lalu, Notebook Jupyter juga ditemukan disalahgunakan oleh penambang kripto karena banyaknya permintaan yang diproses.

Kombinasi dari masalah ini membuat ilmuwan data menjauh dari Jupiter menuju alternatif seperti catatan mendalam. Komunitas riset mengklaim bahwa Deepnote telah mengatasi masalah yang dialami Jupyter dan menyelesaikan beberapa di antaranya. Ketika catatan mendalam Ini memiliki semua fungsi dasar Jupyter, dan juga menawarkan kemewahan kolaborasi waktu nyata. Tidak seperti Jupyter, yang mengharuskan pengguna mengunduh atau mengunggah notebook ke GitHub, versi gratis Deepnote memungkinkan hingga tiga pengguna untuk bekerja bersama.

READ  Universal Control vs Sidecar: Apa bedanya?

Deepnote juga memungkinkan integrasi data yang mudah dari Google Cloud, Postgre SQL, dan Amazon S3, membuat hidup lebih mudah bagi para ilmuwan data. Notebook ini menawarkan opsi antarmuka yang mengharuskan pengguna untuk mengisi beberapa informasi dan menyambung ke sumber dengan sekali klik.

Sumber: Deepnote

Setelah kode ditulis, Deepnote memiliki fitur visualisasi yang secara otomatis mengidentifikasi bingkai data dan mereproduksi grafik dengan opsi bagi pengguna untuk mengubah sumbu X dan sumbu Y sesuai keinginan. Jadi, alih-alih menulis kode lain untuk membuat visualisasi, Deepnote membantu ilmuwan data dengan langkah lanjutan ini. Deepnote juga telah ditingkatkan pada fitur lain seperti pengguna sekarang dapat memeriksa riwayat mereka, meninjau perubahan yang dibuat pada buku catatan, dan kembali jika mereka mau.

Pendiri dan Presiden Deepnote Jacob Gurowicz Dia mengatakan startup bermaksud untuk membangun alat khusus untuk ilmuwan data dengan keuntungan kolaboratif dalam pikiran. Gurovic mengatakan bahwa setiap alat yang dia coba saat memulai gagal mengesankan dalam hal kolaborasi. Dengan transisi ini secara bertahap mengambil alih, ByteDance, Discord, dan HR Gusto telah pindah menggunakan Deepnote. “Saat ini, Deepnote bersinar dalam situasi di mana Anda ingin memindahkan pekerjaan Anda dari lingkungan pitch ke lingkungan yang lebih serius atau kolaboratif, misalnya, tim Anda,” kata Gurovich.

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *