Kunci Mengatasi Hambatan Pengembangan AI

Data Lebih Terpercaya

Intro
Kunci Mengatasi Rintangan AI?
Tantangan Kualitas Data yang Tidak Konsisten
Menavigasi Tuntutan Kepatuhan yang Kompleks
Mengatasi Hambatan Pengembangan AI
Mari Bicara

Pengantar

Kecerdasan buatan mulai menangkap imajinasi ketika Tin Man dari "The Wizard of Oz" mencapai layar perak pada tahun 1939, dan itu hanya memperoleh pijakan yang lebih kuat di zeitgeist sejak saat itu. Namun, dalam penerapannya, produk AI telah melalui siklus boom-and-bust reguler yang sejauh ini menghalangi adopsi yang paling berpengaruh.

Selama booming, insinyur dan peneliti telah membuat langkah yang luar biasa, tetapi ketika aspirasi mereka pasti melampaui kemampuan komputasi yang tersedia pada saat itu, periode dormansi telah mengikuti. Untungnya, peningkatan eksponensial dalam daya komputasi yang diramalkan oleh Hukum Moore pada tahun 1965 sebagian besar terbukti akurat, dan signifikansi peningkatan ini sulit untuk dilebih-lebihkan.

Baca eBook: Kunci Mengatasi Hambatan Pengembangan AI, atau unduh versi PDF eBook.

Daftar Isi

Pengantar

Kunci Mengatasi Rintangan AI?

Tantangan Kualitas Data yang Tidak Konsisten

Menavigasi Tuntutan Kepatuhan yang Kompleks

Mengatasi Hambatan Pengembangan AI

Mari Bicara

Kunci Mengatasi Hambatan Pengembangan AI: Data yang Lebih Andal

Saat ini, rata-rata orang sekarang memiliki jutaan kali lebih banyak daya komputasi di saku mereka daripada yang harus dilakukan NASA untuk melakukan pendaratan di bulan pada tahun 1969. Perangkat di mana-mana yang sama yang dengan mudah menunjukkan kelimpahan daya komputasi juga memenuhi prasyarat lain untuk zaman keemasan AI: banyak data. Menurut wawasan dari Information Overload Research Group, 90% dari data dunia dibuat dalam dua tahun terakhir. Sekarang pertumbuhan eksponensial dalam daya komputasi akhirnya menyatu dengan pertumbuhan yang sama meroketnya dalam generasi data, inovasi data AI meledak begitu banyak sehingga beberapa ahli berpikir akan memulai Revolusi Industri Keempat.

Data dari National Venture Capital Association menunjukkan bahwa sektor AI mencatat rekor investasi $6.9 miliar pada kuartal pertama tahun 2020. Tidak sulit untuk melihat potensi alat AI karena sudah dimanfaatkan di sekitar kita. Beberapa kasus penggunaan yang lebih terlihat untuk produk AI adalah mesin rekomendasi di balik aplikasi favorit kami seperti Spotify dan Netflix. Meskipun menyenangkan untuk menemukan artis baru untuk didengarkan atau acara TV baru untuk ditonton, implementasi ini agak berisiko rendah. Algoritme lain menilai nilai tes — sebagian menentukan di mana siswa diterima di perguruan tinggi — dan yang lainnya menyaring resume kandidat, memutuskan pelamar mana yang mendapatkan pekerjaan tertentu. Beberapa alat AI bahkan dapat memiliki implikasi hidup atau mati, seperti model AI yang menyaring kanker payudara (yang mengungguli dokter).

Terlepas dari pertumbuhan yang stabil baik dalam contoh dunia nyata pengembangan AI dan jumlah perusahaan rintisan yang berlomba-lomba untuk menciptakan alat transformasi generasi berikutnya, tantangan untuk pengembangan dan implementasi yang efektif tetap ada. Secara khusus, output AI hanya seakurat input yang memungkinkan, yang berarti kualitas adalah yang terpenting.

Tantangan Kualitas Data yang Tidak Konsisten dalam Solusi AI

Memang ada jumlah data yang luar biasa yang dihasilkan setiap hari: 2.5 triliun byte, menurut Social Media Today. Tapi itu tidak berarti semuanya layak untuk melatih algoritme Anda. Beberapa data tidak lengkap, beberapa berkualitas rendah, dan beberapa hanya tidak akurat, jadi menggunakan informasi yang salah ini akan menghasilkan sifat yang sama dari inovasi data AI Anda (mahal). Menurut penelitian dari Gartner, sekitar 85% proyek AI yang dibuat pada tahun 2022 akan menghasilkan hasil yang tidak akurat karena data yang bias atau tidak akurat. Meskipun Anda dapat dengan mudah melewatkan rekomendasi lagu yang tidak sesuai dengan selera Anda, algoritme lain yang tidak akurat menimbulkan biaya finansial dan reputasi yang signifikan.

Pada tahun 2018, Amazon mulai menggunakan alat perekrutan bertenaga AI, dalam produksi sejak 2014, yang memiliki bias yang kuat dan tidak salah lagi terhadap wanita. Ternyata model komputer yang mendukung alat tersebut dilatih menggunakan resume yang dikirimkan ke perusahaan selama lebih dari satu dekade. Karena sebagian besar pelamar teknologi adalah laki-laki (dan masih, mungkin karena teknologi ini), algoritme memutuskan untuk menghukum resume dengan memasukkan "wanita" di mana saja — kapten sepak bola wanita atau kelompok bisnis wanita, misalnya. Bahkan memutuskan untuk menghukum pelamar dari dua perguruan tinggi wanita. Amazon mengklaim bahwa alat tersebut tidak pernah digunakan sebagai satu-satunya kriteria untuk mengevaluasi kandidat potensial, namun perekrut melihat mesin rekomendasi saat mencari karyawan baru.

Alat perekrutan Amazon akhirnya dihapus setelah bertahun-tahun bekerja, tetapi pelajarannya tetap ada, menyoroti pentingnya kualitas data saat melatih algoritme dan alat AI. Seperti apa tampilan data "berkualitas tinggi"? Singkatnya, ia memeriksa lima kotak ini:

1. Relevan

Untuk dianggap berkualitas tinggi, data harus membawa sesuatu yang berharga untuk proses pengambilan keputusan. Apakah ada korelasi antara status pelamar kerja sebagai pelompat galah juara negara bagian dan kinerja mereka di tempat kerja? Itu mungkin, tetapi tampaknya sangat tidak mungkin. Dengan menyingkirkan data yang tidak relevan, algoritme dapat berfokus pada pemilahan informasi yang benar-benar memengaruhi hasil.

2. Akurat

Data yang Anda gunakan harus secara akurat mewakili ide yang Anda uji. Jika tidak, itu tidak layak. Misalnya, Amazon melatih algoritme perekrutannya menggunakan 10 tahun resume pelamar, tetapi tidak jelas apakah perusahaan mengkonfirmasi informasi yang diberikan pada resume tersebut terlebih dahulu. Penelitian dari perusahaan pemeriksa referensi Checkster menunjukkan bahwa 78% pelamar berbohong atau akan mempertimbangkan untuk berbohong pada lamaran pekerjaan. Jika suatu algoritme membuat keputusan rekomendasi menggunakan IPK kandidat, misalnya, ada baiknya untuk terlebih dahulu mengonfirmasi keaslian angka-angka tersebut. Proses ini akan memakan waktu dan uang, tetapi juga tidak diragukan lagi akan meningkatkan akurasi hasil Anda.

3. Diatur dan diberi keterangan dengan benar

Dalam kasus model perekrutan berdasarkan resume, anotasi relatif mudah. Dalam arti tertentu, resume datang dengan anotasi sebelumnya, meskipun tidak diragukan lagi ada pengecualian. Sebagian besar pelamar mencantumkan pengalaman kerja mereka di bawah judul "Pengalaman" dan keterampilan yang relevan di bawah "Keterampilan". Namun, dalam situasi lain, seperti skrining kanker, data akan jauh lebih bervariasi. Informasi mungkin datang dalam bentuk pencitraan medis, hasil pemeriksaan fisik, atau bahkan percakapan antara dokter dan pasien tentang riwayat kesehatan keluarga dan kasus kanker, di antara bentuk data lainnya. Agar informasi ini berkontribusi pada algoritme deteksi yang akurat, informasi ini harus diatur dan diberi anotasi dengan hati-hati untuk memastikan model AI belajar membuat prediksi yang akurat berdasarkan inferensi yang tepat.

4. Terkini

Amazon berusaha menciptakan alat yang akan menghemat waktu dan uang dengan mereproduksi keputusan perekrutan yang sama yang dibuat manusia dalam waktu yang jauh lebih singkat. Untuk membuat rekomendasi seakurat mungkin, data perlu terus diperbarui. Jika sebuah perusahaan pernah menunjukkan preferensi untuk kandidat dengan kemampuan untuk memperbaiki mesin tik, misalnya, perekrutan bersejarah ini mungkin tidak akan banyak berpengaruh pada kesesuaian pelamar kerja saat ini untuk jenis peran apa pun. Akibatnya, akan bijaksana untuk menghapusnya.

5. Cukup beragam

Insinyur Amazon memilih untuk melatih algoritme dengan kumpulan pelamar yang sebagian besar pria. Keputusan ini merupakan kesalahan kritis, dan itu dibuat tidak kurang mengerikan oleh fakta bahwa itu adalah resume perusahaan yang tersedia pada saat itu. Insinyur Amazon dapat bermitra dengan organisasi terhormat yang serupa posisi yang tersedia yang telah menerima lebih banyak pelamar kerja perempuan untuk menutupi kekurangan, atau bisa saja secara artifisial mengurangi jumlah resume pria agar sesuai dengan jumlah wanita dan terlatih dan memandu algoritma dengan representasi populasi yang lebih akurat. Intinya adalah data itu keragaman adalah kuncinya, dan kecuali upaya bersama dilakukan untuk menghilangkan bias dalam input, output yang bias akan mengungguli.

Jelas, data berkualitas tinggi tidak muncul begitu saja. Sebaliknya, itu harus hati-hati dikuratori dengan hasil yang diinginkan dalam pikiran. Di bidang AI, sering dikatakan bahwa “sampah masuk berarti sampah keluar.” Pernyataan ini benar, tetapi agak meremehkan pentingnya kualitas. AI dapat memproses informasi dalam jumlah yang luar biasa dan mengubahnya menjadi apa saja, mulai dari pemilihan stok hingga rekomendasi perekrutan hingga diagnosis medis. Kapasitas ini jauh melebihi kemampuan manusia, yang juga berarti memperbesar hasil. Satu perekrut manusia yang bias hanya bisa mengabaikan begitu banyak wanita, tetapi perekrut AI yang bias bisa mengabaikan mereka semua. Dalam hal ini, sampah masuk tidak hanya berarti sampah keluar — ini berarti sejumlah kecil data “sampah” dapat berubah menjadi seluruh TPA.

Menavigasi Tuntutan Kepatuhan yang Kompleks

Seolah-olah menemukan data berkualitas tidak cukup sulit, beberapa industri yang paling diuntungkan dari inovasi data AI juga paling banyak diatur. Layanan kesehatan mungkin adalah contoh terbaik, dan meskipun survei dari HIT Infrastructure menemukan bahwa 91% orang dalam industri berpikir bahwa teknologi dapat meningkatkan akses ke perawatan, optimisme itu dilunakkan oleh fakta bahwa 75% melihatnya sebagai ancaman terhadap keamanan dan privasi pasien. — dan pasien bukan satu-satunya yang berisiko.

Peraturan menyeluruh yang diberlakukan melalui Health Insurance Portability and Accountability Act kini bersinggungan dengan berbagai rintangan kepatuhan data lokal seperti Peraturan Perlindungan Data Umum Eropa, Undang-Undang Privasi Konsumen California di Amerika Serikat, dan Undang-Undang Perlindungan Data Pribadi di Singapura. Peraturan lokal ini akan diikuti oleh lebih banyak lagi, dan karena telehealth muncul sebagai sumber data perawatan kesehatan yang lebih signifikan, kemungkinan peraturan tersebut akan semakin ketat menguasai data pasien dalam perjalanan. Akibatnya, platform cloud Shaip yang aman dan patuh akan terbukti menjadi sarana yang lebih berharga untuk mengumpulkan dan mengakses data perawatan kesehatan untuk melatih produk AI.

Informasi yang dapat diidentifikasi secara pribadi dapat menjadi ancaman signifikan bagi pengembangan AI Anda, tetapi bahkan implementasi yang sepenuhnya patuh pun berisiko jika tidak dapat memberikan hasil akurat yang hanya datang dengan data pelatihan yang beragam. Sebuah studi tahun 2020 di Journal of American Medical Association menunjukkan bahwa algoritma pembelajaran mesin di bidang medis paling sering dilatih dengan data dari pasien di California, New York, dan Massachusetts. Mengingat bahwa pasien ini mewakili kurang dari seperlima dari populasi AS, untuk tidak mengatakan apa-apa dari seluruh dunia, sulit untuk membayangkan bagaimana model ini dapat menghasilkan apa pun kecuali hasil yang bias.

Menyadari kesulitan dalam mengamankan informasi yang sesuai dan beragam secara geografis, Shaip menawarkan data perawatan kesehatan berlisensi dari berbagai wilayah yang secara khusus dikuratori dengan tujuan membangun algoritme yang akurat. Data ini datang dalam bentuk teks, seperti catatan medis atau informasi klaim, pencitraan diagnostik medis seperti CT scan, audio seperti catatan lisan dari dokter atau percakapan antara dokter dan pasien, dan bahkan video dari hasil MRI. Ini juga sepenuhnya dideidentifikasi dan dianonimkan, melindungi organisasi Anda dari implikasi etis dan finansial yang dapat mengikuti pelanggaran terhadap salah satu dari peningkatan jumlah peraturan yang mengatur data asal domestik dan internasional.

Mengatasi Hambatan Pengembangan AI

Upaya pengembangan AI mencakup hambatan yang signifikan tidak peduli di industri apa mereka berada, dan proses mendapatkan dari ide yang layak menjadi produk yang sukses penuh dengan kesulitan. Di antara tantangan untuk memperoleh data yang tepat dan kebutuhan untuk menganonimkannya untuk mematuhi semua peraturan yang relevan, rasanya seperti benar-benar membangun dan melatih algoritme adalah bagian yang mudah.

Untuk memberi organisasi Anda setiap keuntungan yang diperlukan dalam upaya merancang pengembangan AI baru yang inovatif, Anda sebaiknya mempertimbangkan untuk bermitra dengan perusahaan seperti Shaip. Chetan Parikh dan Vatsal Ghiya mendirikan Shaip untuk membantu perusahaan merancang jenis solusi yang dapat mengubah perawatan kesehatan di AS Setelah lebih dari 16 tahun dalam bisnis, perusahaan kami telah berkembang dengan menyertakan lebih dari 600 anggota tim, dan kami telah bekerja dengan ratusan pelanggan untuk mengubah ide menarik menjadi solusi AI.

Dengan orang-orang, proses, dan platform kami yang bekerja untuk organisasi Anda, Anda dapat segera membuka empat manfaat berikut dan melontarkan proyek Anda menuju penyelesaian yang sukses:

1. Kapasitas untuk membebaskan ilmuwan data Anda

Tidak dapat disangkal bahwa proses pengembangan AI membutuhkan investasi waktu yang cukup besar, tetapi Anda selalu dapat mengoptimalkan fungsi yang paling banyak dilakukan oleh tim Anda. Anda mempekerjakan ilmuwan data Anda karena mereka ahli dalam pengembangan algoritme canggih dan model pembelajaran mesin, tetapi penelitian secara konsisten menunjukkan bahwa para pekerja ini benar-benar menghabiskan 80% waktu mereka untuk mencari, membersihkan, dan mengatur data yang akan mendukung proyek. Lebih dari tiga perempat (76%) ilmuwan data melaporkan bahwa proses pengumpulan data biasa ini juga merupakan bagian pekerjaan yang paling tidak disukai, tetapi kebutuhan akan data berkualitas menyisakan hanya 20% waktu mereka untuk pengembangan aktual, yaitu pekerjaan yang paling menarik dan merangsang secara intelektual bagi banyak ilmuwan data. Dengan sumber data melalui vendor pihak ketiga seperti Shaip, perusahaan dapat membiarkan insinyur datanya yang mahal dan berbakat mengalihdayakan pekerjaan mereka sebagai petugas kebersihan data dan sebagai gantinya menghabiskan waktu mereka di bagian solusi AI di mana mereka dapat menghasilkan nilai paling banyak.

2. Kemampuan untuk mencapai hasil yang lebih baik

Banyak pemimpin pengembangan AI memutuskan untuk menggunakan data open-source atau crowdsourced untuk mengurangi biaya, tetapi keputusan ini hampir selalu berakhir dengan biaya lebih dalam jangka panjang. Jenis data ini sudah tersedia, tetapi tidak dapat menandingi kualitas kumpulan data yang dikuratori dengan cermat. Data crowdsourced khususnya penuh dengan kesalahan, kelalaian, dan ketidakakuratan, dan meskipun masalah ini terkadang dapat diselesaikan selama proses pengembangan di bawah pengawasan teknisi Anda, dibutuhkan iterasi tambahan yang tidak diperlukan jika Anda memulai dengan yang lebih tinggi -data berkualitas dari awal.

Mengandalkan data sumber terbuka adalah jalan pintas umum lainnya yang datang dengan serangkaian perangkapnya sendiri. Kurangnya diferensiasi adalah salah satu masalah terbesar, karena algoritme yang dilatih menggunakan data sumber terbuka lebih mudah direplikasi daripada yang dibangun di atas kumpulan data berlisensi. Dengan menempuh rute ini, Anda mengundang persaingan dari pendatang lain di ruang angkasa yang dapat menurunkan harga Anda dan mengambil pangsa pasar kapan saja. Saat Anda mengandalkan Shaip, Anda mengakses data berkualitas tinggi yang dikumpulkan oleh tenaga kerja terkelola yang terampil, dan kami dapat memberi Anda lisensi eksklusif untuk kumpulan data khusus yang mencegah pesaing dengan mudah menciptakan kembali kekayaan intelektual Anda yang diperoleh dengan susah payah.

3. Akses ke profesional berpengalaman experienced

Bahkan jika daftar internal Anda termasuk insinyur terampil dan ilmuwan data berbakat, alat AI Anda dapat mengambil manfaat dari kebijaksanaan yang hanya datang melalui pengalaman. Pakar materi pelajaran kami telah mempelopori banyak implementasi AI di bidang mereka dan mempelajari pelajaran berharga di sepanjang jalan, dan satu-satunya tujuan mereka adalah membantu Anda mencapai tujuan Anda.

Dengan pakar domain yang mengidentifikasi, mengatur, mengkategorikan, dan melabeli data untuk Anda, Anda tahu informasi yang digunakan untuk melatih algoritme Anda dapat menghasilkan hasil terbaik. Kami juga melakukan penjaminan kualitas secara berkala untuk memastikan bahwa data memenuhi standar tertinggi dan akan berfungsi sebagaimana dimaksud tidak hanya di laboratorium, tetapi juga dalam situasi dunia nyata.

4. Garis waktu pengembangan yang dipercepat

Pengembangan AI tidak terjadi dalam semalam, tetapi itu bisa terjadi lebih cepat ketika Anda bermitra dengan Shaip. Pengumpulan dan anotasi data internal menciptakan hambatan operasional yang signifikan yang menahan sisa proses pengembangan. Bekerja dengan Shaip memberi Anda akses instan ke perpustakaan data siap pakai kami yang luas, dan para ahli kami akan dapat memperoleh segala jenis input tambahan yang Anda butuhkan dengan pengetahuan industri mendalam dan jaringan global kami. Tanpa beban sumber dan anotasi, tim Anda dapat langsung mengerjakan pengembangan aktual, dan model pelatihan kami dapat membantu mengidentifikasi ketidakakuratan awal untuk mengurangi iterasi yang diperlukan untuk memenuhi sasaran akurasi.

Jika Anda belum siap untuk mengalihdayakan semua aspek manajemen data Anda, Shaip juga menawarkan platform berbasis cloud yang membantu tim menghasilkan, mengubah, dan membuat anotasi berbagai jenis data secara lebih efisien, termasuk dukungan untuk gambar, video, teks, dan audio. . ShaipCloud mencakup berbagai alat validasi dan alur kerja intuitif, seperti solusi yang dipatenkan untuk melacak dan memantau beban kerja, alat transkripsi untuk menyalin rekaman audio yang rumit dan sulit, dan komponen kontrol kualitas untuk memastikan kualitas tanpa kompromi. Yang terbaik dari semuanya, ini dapat diskalakan, sehingga dapat berkembang seiring dengan meningkatnya berbagai tuntutan proyek Anda.

Era inovasi AI baru saja dimulai, dan kita akan melihat kemajuan dan inovasi luar biasa di tahun-tahun mendatang yang berpotensi membentuk kembali seluruh industri atau bahkan mengubah masyarakat secara keseluruhan. Di Shaip, kami ingin menggunakan keahlian kami untuk menjadi kekuatan transformatif, membantu perusahaan paling revolusioner di dunia memanfaatkan kekuatan solusi AI untuk mencapai tujuan yang ambisius.

Kami memiliki pengalaman mendalam dalam aplikasi perawatan kesehatan dan AI percakapan, tetapi kami juga memiliki keterampilan yang diperlukan untuk melatih model untuk hampir semua jenis aplikasi. Untuk informasi lebih lanjut tentang bagaimana Shaip dapat membantu proyek Anda dari ide hingga implementasi, lihat banyak sumber daya yang tersedia di situs web kami atau hubungi kami hari ini.

Ayo Bicara

Nama Depan*
Nama Belakang*
Email*
Nomor Hp / Telephone*
Perusahaan*
Negara*
Negara
komentar*
Dengan mendaftar, saya setuju dengan Shaip Kebijakan Privasi dan Ketentuan Layanan dan memberikan persetujuan saya untuk menerima komunikasi pemasaran B2B dari Shaip.
CAPTCHA