Sekarang Dapatkan DISKON 50* pada Dataset Percakapan AI Off-the-Shelf

Kumpulan data Ucapan & Audio untuk chatbot, asisten suara, perangkat yang mendukung ucapan.

*Penawaran Periode Terbatas

  • Dengan mendaftar, saya setuju dengan Shaip Kebijakan Privasi dan Ketentuan Layanan dan memberikan persetujuan saya untuk menerima komunikasi pemasaran B2B dari Shaip.

Dipercaya oleh Pemimpin Industri

RincianKumpulan Data Bahasa siap pakaiPercakapan Pusat Panggilan 8khz*Percakapan Umum 8khz*Media & Podcast 16khz*Monolog Ucapan/ Skrip 16khz*Total Volume dalam JamDialek tertutupAudio FormatFormat Transkripsi TeksUse CasesumberCTA
PidatoAfrikanasKumpulan Data Audio Afrikaans6009001500Bahasa Afrikaans dituturkan di Afrika. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaShaip
PidatoArabKumpulan Data Audio Arab80015002300Arab dari negara-negara Teluk. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaShaip
PidatoCinaKumpulan Data Audio Cina20002000Cina dari Cina. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaShaip
PidatoDenmarkKumpulan Data Audio Denmark40060020003000Denmark dari Denmark. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaShaip
PidatoDutchKumpulan Data Audio Belanda20002000belanda dari belanda. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaShaip
PidatoBahasa Inggris - Aksen AAVEBahasa Inggris - Kumpulan Data Audio AAVE (African American Vernacular English)5005001000Varietas vernakular (kadang-kadang dikenal sebagai AAVE, biasanya diucapkan oleh sebagian besar pekerja dan kelas menengah Afrika-Amerika) dan varietas yang lebih standar (biasanya diucapkan oleh kelas menengah Afrika-Amerika dalam situasi formal dan publik) tetapi dengan penekanan yang lebih kuat. pada bahasa daerah.. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaShaip
PidatoInggris - Aksen Boston/New YorkBahasa Inggris - Kumpulan Data Audio Boston/New York225225350800Ini adalah kumpulan beberapa aksen daerah yang diucapkan di dan sekitar kota Boston, New York, dan Philadelphia. Aksen ini mungkin terdengar mirip dengan non-lokal, tetapi berbeda dari aksen Amerika lainnya. Terlepas dari beberapa kosakata lokal yang berbeda dari bagian lain dunia berbahasa Inggris, aksen ini saling dimengerti dengan bahasa Inggris yang diucapkan di tempat lain.. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaShaip
PidatoBahasa Inggris - Aksen CinaKumpulan Data Audio Beraksen Bahasa Inggris - Cina150300450Penutur yang berbicara bahasa Cina sebagai bahasa pertama mereka dan yang pindah/imigrasi ke Amerika Serikat sebagai remaja/dewasa dan belajar bahasa Inggris sebagai bahasa kedua mereka.. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaShaip
PidatoBahasa Inggris - Aksen Selatan JauhBahasa Inggris - Kumpulan Data Audio Selatan Jauh2752754501000Pembicara dari (i) Texas; (ii) Carolina Utara, Carolina Selatan, Georgia; (iii) New Orleans; (iv) penjulur Florida; (v) Tennessee, Arkansas, Michigan.. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaShaip
PidatoBahasa Inggris - Aksen HispanikBahasa Inggris - Kumpulan Data Audio Beraksen Hispanik400400800Bahasa Inggris Hispanik mengacu pada variasi bahasa Inggris AS yang digunakan oleh orang Amerika Hispanik dari warisan nasional yang beragam. Fokus utama adalah pada orang Amerika Meksiko, penutur dari negara asal yang berbeda (misalnya Meksiko, Puerto Riko, Republik Dominika, Ekuador, Kuba, dll) dan dari berbagai daerah (misalnya California, New York, Florida) juga. Pembicara yang disertakan adalah yang berbahasa Spanyol sebagai bahasa pertama serta penutur asal Hispanik yang berbahasa Spanyol memiliki bahasa warisan.. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaShaip
PidatoBahasa Inggris - Aksen Selandia BaruBahasa Inggris - Kumpulan Data Audio Selandia Baru2507501000Penutur di kedua pulau, termasuk campuran penutur yang lebih muda (<40 tahun) dan penutur yang lebih tua (>40 tahun) dalam proporsi yang sama.. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaShaip
PidatoBahasa Inggris - Aksen SingapuraBahasa Inggris - Kumpulan Data Audio Singapura4006001000Baik Bahasa Inggris Singapura Standar maupun Bahasa Inggris Singapura Bahasa sehari-hari. Orang Singapura dari latar belakang etnis yang berbeda (misalnya Cina, Melayu, India, dll) dan tingkat pendidikan yang berbeda.. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaShaip
PidatoBahasa Inggris - Aksen Afrika SelatanBahasa Inggris - Kumpulan Data Audio Afrika Selatan4006001000Perwakilan dari berbagai kelas sosial ekonomi dan latar belakang etnologi (misalnya Afrika Selatan dari Eropa, Afrika, India, atau latar belakang campuran).. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaShaip
PidatoBahasa Inggris - Aksen IrlandiaBahasa Inggris - Kumpulan Data Audio Irlandia500500Bahasa Inggris dituturkan di Irlandia. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaShaip
PidatoInggris - Aksen SkotlandiaBahasa Inggris - Kumpulan Data Audio Skotlandia800800Bahasa Inggris dituturkan oleh orang Skotlandia. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaShaip
PidatoBahasa Inggris - Aksen WelshBahasa Inggris - Kumpulan Data Audio Welsh800800Bahasa Inggris Welsh. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaShaip
PidatoPerancis KanadaKumpulan Data Audio Prancis Kanada10001000Perancis Kanada. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaShaip
PidatoIbraniKumpulan Data Audio Ibrani7507501500Ibrani di Israel. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaShaip
PidatoIndonesiaKumpulan Data Audio Indonesia100010002000Bahasa Indonesia. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaShaip
PidatoJepangKumpulan Data Audio Jepang20002000Jepang dari Jepang. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaShaip
PidatoKoreaKumpulan Data Audio Korea10020015001800Pembicara tersebar di seluruh Korea Selatan.. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaShaip
PidatoMalayKumpulan Data Audio Melayu5005001000bahasa melayu di malaysia. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaShaip
PidatoSpanyol SpanyolKumpulan Data Audio Spanyol Meksiko12501250Meksiko dari Meksiko. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaShaip
PidatosemirKumpulan Data Audio Polandia25020002250Polandia dari Polandia. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaShaip
PidatoRusiaKumpulan Data Audio Rusia20002000Rusia dari Rusia. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaShaip
PidatoswahiliKumpulan Data Audio Swahili3506501000Afrika Selatan dan Kenya Swahili. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaShaip
PidatoSwediaKumpulan Data Audio Swedia3506501000Swedia di Swedia. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaShaip
PidatoTaiwan CinaKumpulan Data Audio Cina Taiwan10001000Cina dari Taiwan. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaShaip
PidatoThailandKumpulan Data Audio Thailand350450800Sebuah register informal yang digunakan antara teman-teman,. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaShaip
PidatoTurkiKumpulan Data Audio Turki20002000Turki dari Turki. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaShaip
PidatoVietnamKumpulan Data Audio Vietnam6004001000Utara (misalnya, Hanoi), Tengah, dan Selatan (misalnya, Kota Ho Chi Minh).. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaShaip
PidatoHindiKumpulan Data Audio Hindi80020002800Bahasa Hindi di India khususnya di wilayah Utara, Timur dan Barat. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaShaip
PidatoBahasa inggrisKumpulan Data Audio Bahasa Inggris India300500800Dikumpulkan dari kota-kota perkotaan India yang merupakan pusat keuangan negara karena peluang ekonomi yang berkembang. Tempat-tempat tersebut dapat berupa Noida, Delhi, Dehradun, Chandigarh, Mumbai, Kolkata, Bangalore, Pune, Chennai, Hyderabad, dll.. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaShaip
PidatoInggrisKumpulan Data Audio Bahasa Inggris700700. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaShaip
PidatokannadaKumpulan Data Audio Kannada6010040200Kannada dari Karnataka, India. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaShaip
PidatoMalayalamKumpulan Data Audio Malayalam6010040200Malayalam dari Kerala, Lakshadweep dan Puducherry. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaShaip
PidatoOriyaKumpulan Data Audio Oriya6010040200Oriya dari bagian Odisha, Benggala Barat, Jharkhand dan Chhattisgarh. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaShaip
PidatopunjabiKumpulan Data Audio Punjabi6010040200Punjabi dari Punjab, India. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaShaip
PidatoTamilKumpulan Data Audio Tamil60100240400Tamil dari Tamil Nadu, India. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaShaip
PidatoteluguKumpulan Data Audio Telugu1009509502000Telugu dari Andhra Pradesh, India. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaShaip
PidatoBenggalaKumpulan Data Audio Bengali6010040200Bengali dari Benggala Barat, India. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaShaip
PidatogujaratiKumpulan Data Audio Gujarat6010040200Gujarati dari Gujarat, India. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaShaip
PidatoMarathiKumpulan Data Audio Marathi6010040200Marathi dari Maharashtra, India. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaShaip
PidatoAssameseKumpulan Data Audio Assam6010040200Assam dari Asssam, India. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaShaip

Keahlian mendalam dalam AI Percakapan

AI percakapan atau Chatbots atau Asisten Virtual / Digital hanya secerdas teknologi dan data di belakangnya. Di Shaip, kami menawarkan kepada Anda kumpulan dataset audio yang beragam untuk Natural Language Processing (NLP) yang meniru percakapan dengan orang sungguhan yang memungkinkan Anda menghidupkan AI Anda. Dengan pemahaman mendalam kami, kami membantu Anda membangun dan melokalkan model ucapan berkemampuan AI, dengan presisi tertinggi dengan kumpulan data yang kaya dan terstruktur dalam berbagai bahasa dari seluruh dunia. Kami menawarkan koleksi audio multi-bahasa, transkripsi audio, dan layanan anotasi audio berdasarkan kebutuhan Anda, sambil sepenuhnya menyesuaikan maksud, ucapan, dan distribusi demografis yang diinginkan.

Koleksi Pidato Naskah

Koleksi Pidato Spontan

Transkripsi Data Audio

Pelabelan & Anotasi Data

Shaip memungkinkan Anda melatih Platform AI Percakapan Anda secara akurat sehingga dapat:

  • Berbicara, mengirim pesan, dan mengobrol dengan lancar di berbagai saluran.
  • Belajar dari interaksi yang ada dalam bentuk chat, transkrip suara, transaksi, dll dan menyarankan & berkomunikasi, berdasarkan pembelajaran tersebut.
  • Memahami maksud di balik ucapan manusia dan menghilangkan ambiguitas dalam memahami bahasa manusia.
  • Berinteraksi dengan Anda secara pribadi dan dapat dilatih untuk mengidentifikasi pengguna dan mengingat percakapan sebelumnya.

Pemimpin Dunia dalam Data Pelatihan AI Percakapan

Jam data audio dalam 100+ bahasa – Bersumber, Ditranskripsi & Beranotasi

Lisensi Data Ucapan​

20rb+ jam Data Pidato dalam 40+ bahasa dan dialek yang mencakup 55+ topik dari berbagai domain yaitu, Pusat panggilan, Debat, Percakapan umum, Pidato, podcast, dll.

Pengumpulan Data Ucapan

Kumpulkan data audio & ucapan (monolog, percakapan 2 orang, obrolan bot manusia) dalam lebih dari 100 bahasa dari seluruh dunia, yang disesuaikan dengan kebutuhan AI Anda.

Transkripsi Data Ucapan

Transkripsi audio atau anotasi audio yang hemat biaya melalui tenaga kerja yang kuat dari 30,000 kolaborator dengan TAT, akurasi, dan penghematan yang terjamin

Percepat pengembangan aplikasi AI Percakapan Anda dengan Koleksi Audio & Layanan Anotasi Audio

Keuntungan Shaip

skala

Kami dapat mencari, menskalakan, dan mengirimkan data audio dari seluruh dunia dalam berbagai bahasa dan dialek berdasarkan kebutuhan Anda.

Keahlian

Kami memiliki keahlian yang tepat terkait pengumpulan data, transkripsi, dan anotasi standar yang akurat dan tidak memihak.

jaringan

Jaringan dengan 30,000+ kontributor yang memenuhi syarat, yang dapat dengan cepat diberi tugas pengumpulan data untuk membangun model pelatihan AI & layanan peningkatan.

Teknologi

Kami memiliki platform berbasis AI sepenuhnya dengan alat & proses berpemilik untuk memanfaatkan manajemen alur kerja 24*7 sepanjang waktu.

Kelincahan

Kami beradaptasi dengan perubahan kebutuhan pelanggan dengan sangat cepat dan membantu mempercepat pengembangan AI dengan data ucapan berkualitas 5-10x lebih cepat dari pesaing.

Security

Kami sangat mementingkan keamanan dan privasi data dan juga bersertifikat untuk menangani data sensitif yang sangat diatur.

Apa yang Kami Lakukan Terbaik

Data pelatihan

Dapatkan data berlabel kualitas tertinggi dalam waktu singkat. Ini standar emas, andal, dan siap untuk melatih model AI dan ML Anda untuk mencapai tingkat kinerja tertinggi.

Pelajari Lebih Lanjut

Pengumpulan Data, Pelabelan & Anotasi

Dengan Shaip, Anda mendapatkan 15+ tahun keahlian yang telah terbukti dalam mengumpulkan, menyalin, dan membuat anotasi data berkualitas. Dengan tenaga kerja global kami, kami dapat mengumpulkan data dari seluruh dunia, kemudian memberikan layanan pelabelan dan anotasi dengan tingkat keterampilan dan keahlian yang diperlukan untuk data Anda.

Pelajari Lebih Lanjut

Katalog & Lisensi Data

Dengan inventaris jutaan kumpulan data kami yang sangat besar, Anda dapat mengumpulkan dan mengatur sesuai kebutuhan. Kami kemudian dapat melisensikan data berkualitas tersebut untuk persyaratan penggunaan AI dan ML spesifik Anda. Selain itu, data ini tersedia dengan biaya yang lebih murah jika Anda membuatnya sendiri.

Pelajari Lebih Lanjut

Ingin membuat kumpulan data Anda sendiri?

Hubungi kami sekarang untuk mempelajari bagaimana kami dapat mengumpulkan kumpulan data khusus untuk solusi AI unik Anda.