Sekarang Dapatkan DISKON 50* pada Dataset Percakapan AI Off-the-Shelf
Kumpulan data Ucapan & Audio untuk chatbot, asisten suara, perangkat yang mendukung ucapan.
*Penawaran Periode Terbatas
Dipercaya oleh Pemimpin Industri
Rincian | Kata kunci | Kumpulan Data Bahasa siap pakai | Percakapan Pusat Panggilan 8khz* | Percakapan Umum 8khz* | Media & Podcast 16khz* | Monolog Ucapan/ Skrip 16khz* | Total Volume dalam Jam | Dialek tertutup | Audio Format | Format Transkripsi Teks | Use Case | sumber | CTA |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Afrikanas | Kumpulan Data Audio Afrikaans | 600 | 900 | 1500 | Bahasa Afrikaans dituturkan di Afrika | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Shaip | Kontak Kontak | |||
Arab | Kumpulan Data Audio Arab | 800 | 1500 | 2300 | Arab dari negara-negara Teluk | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Shaip | Kontak Kontak | |||
Cina | Kumpulan Data Audio Cina | 2000 | 2000 | Cina dari Cina | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Shaip | Kontak Kontak | ||||
Denmark | Kumpulan Data Audio Denmark | 400 | 600 | 2000 | 3000 | Denmark dari Denmark | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Shaip | Kontak Kontak | ||
Dutch | Kumpulan Data Audio Belanda | 2000 | 2000 | belanda dari belanda | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Shaip | Kontak Kontak | ||||
Bahasa Inggris - Aksen AAVE | Bahasa Inggris - Kumpulan Data Audio AAVE (African American Vernacular English) | 500 | 500 | 1000 | Varietas vernakular (kadang-kadang dikenal sebagai AAVE, biasanya diucapkan oleh sebagian besar pekerja dan kelas menengah Afrika-Amerika) dan varietas yang lebih standar (biasanya diucapkan oleh kelas menengah Afrika-Amerika dalam situasi formal dan publik) tetapi dengan penekanan yang lebih kuat. pada bahasa daerah. | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Shaip | Kontak Kontak | |||
Inggris - Aksen Boston/New York | Bahasa Inggris - Kumpulan Data Audio Boston/New York | 225 | 225 | 350 | 800 | Ini adalah kumpulan beberapa aksen daerah yang diucapkan di dan sekitar kota Boston, New York, dan Philadelphia. Aksen ini mungkin terdengar mirip dengan non-lokal, tetapi berbeda dari aksen Amerika lainnya. Terlepas dari beberapa kosakata lokal yang berbeda dari bagian lain dunia berbahasa Inggris, aksen ini saling dimengerti dengan bahasa Inggris yang diucapkan di tempat lain. | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Shaip | Kontak Kontak | ||
Bahasa Inggris - Aksen Cina | Kumpulan Data Audio Beraksen Bahasa Inggris - Cina | 150 | 300 | 450 | Penutur yang berbicara bahasa Cina sebagai bahasa pertama mereka dan yang pindah/imigrasi ke Amerika Serikat sebagai remaja/dewasa dan belajar bahasa Inggris sebagai bahasa kedua mereka. | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Shaip | Kontak Kontak | |||
Bahasa Inggris - Aksen Selatan Jauh | Bahasa Inggris - Kumpulan Data Audio Selatan Jauh | 275 | 275 | 450 | 1000 | Pembicara dari (i) Texas; (ii) Carolina Utara, Carolina Selatan, Georgia; (iii) New Orleans; (iv) penjulur Florida; (v) Tennessee, Arkansas, Michigan. | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Shaip | Kontak Kontak | ||
Bahasa Inggris - Aksen Hispanik | Bahasa Inggris - Kumpulan Data Audio Beraksen Hispanik | 400 | 400 | 800 | Bahasa Inggris Hispanik mengacu pada variasi bahasa Inggris AS yang digunakan oleh orang Amerika Hispanik dari warisan nasional yang beragam. Fokus utama adalah pada orang Amerika Meksiko, penutur dari negara asal yang berbeda (misalnya Meksiko, Puerto Riko, Republik Dominika, Ekuador, Kuba, dll) dan dari berbagai daerah (misalnya California, New York, Florida) juga. Pembicara yang disertakan adalah yang berbahasa Spanyol sebagai bahasa pertama serta penutur asal Hispanik yang berbahasa Spanyol memiliki bahasa warisan. | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Shaip | Kontak Kontak | |||
Bahasa Inggris - Aksen Selandia Baru | Bahasa Inggris - Kumpulan Data Audio Selandia Baru | 250 | 750 | 1000 | Penutur di kedua pulau, termasuk campuran penutur yang lebih muda (<40 tahun) dan penutur yang lebih tua (>40 tahun) dalam proporsi yang sama. | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Shaip | Kontak Kontak | |||
Bahasa Inggris - Aksen Singapura | Bahasa Inggris - Kumpulan Data Audio Singapura | 400 | 600 | 1000 | Baik Bahasa Inggris Singapura Standar maupun Bahasa Inggris Singapura Bahasa sehari-hari. Orang Singapura dari latar belakang etnis yang berbeda (misalnya Cina, Melayu, India, dll) dan tingkat pendidikan yang berbeda. | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Shaip | Kontak Kontak | |||
Bahasa Inggris - Aksen Afrika Selatan | Bahasa Inggris - Kumpulan Data Audio Afrika Selatan | 400 | 600 | 1000 | Perwakilan dari berbagai kelas sosial ekonomi dan latar belakang etnologi (misalnya Afrika Selatan dari Eropa, Afrika, India, atau latar belakang campuran). | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Shaip | Kontak Kontak | |||
Bahasa Inggris - Aksen Irlandia | Bahasa Inggris - Kumpulan Data Audio Irlandia | 500 | 500 | Bahasa Inggris dituturkan di Irlandia | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Shaip | Kontak Kontak | ||||
Inggris - Aksen Skotlandia | Bahasa Inggris - Kumpulan Data Audio Skotlandia | 800 | 800 | Bahasa Inggris dituturkan oleh orang Skotlandia | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Shaip | Kontak Kontak | ||||
Bahasa Inggris - Aksen Welsh | Bahasa Inggris - Kumpulan Data Audio Welsh | 800 | 800 | Bahasa Inggris Welsh | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Shaip | Kontak Kontak | ||||
Perancis Kanada | Kumpulan Data Audio Prancis Kanada | 1000 | 1000 | Perancis Kanada | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Shaip | Kontak Kontak | ||||
Ibrani | Kumpulan Data Audio Ibrani | 750 | 750 | 1500 | Ibrani di Israel | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Shaip | Kontak Kontak | |||
Indonesia | Kumpulan Data Audio Indonesia | 1000 | 1000 | 2000 | Bahasa Indonesia | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Shaip | Kontak Kontak | |||
Jepang | Kumpulan Data Audio Jepang | 2000 | 2000 | Jepang dari Jepang | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Shaip | Kontak Kontak | ||||
Korea | Kumpulan Data Audio Korea | 100 | 200 | 1500 | 1800 | Pembicara tersebar di seluruh Korea Selatan. | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Shaip | Kontak Kontak | ||
Malay | Kumpulan Data Audio Melayu | 500 | 500 | 1000 | bahasa melayu di malaysia | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Shaip | Kontak Kontak | |||
Spanyol Spanyol | Kumpulan Data Audio Spanyol Meksiko | 1250 | 1250 | Meksiko dari Meksiko | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Shaip | Kontak Kontak | ||||
semir | Kumpulan Data Audio Polandia | 250 | 2000 | 2250 | Polandia dari Polandia | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Shaip | Kontak Kontak | |||
Rusia | Kumpulan Data Audio Rusia | 2000 | 2000 | Rusia dari Rusia | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Shaip | Kontak Kontak | ||||
swahili | Kumpulan Data Audio Swahili | 350 | 650 | 1000 | Afrika Selatan dan Kenya Swahili | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Shaip | Kontak Kontak | |||
Swedia | Kumpulan Data Audio Swedia | 350 | 650 | 1000 | Swedia di Swedia | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Shaip | Kontak Kontak | |||
Taiwan Cina | Kumpulan Data Audio Cina Taiwan | 1000 | 1000 | Cina dari Taiwan | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Shaip | Kontak Kontak | ||||
Thailand | Kumpulan Data Audio Thailand | 350 | 450 | 800 | Sebuah register informal yang digunakan antara teman-teman, | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Shaip | Kontak Kontak | |||
Turki | Kumpulan Data Audio Turki | 2000 | 2000 | Turki dari Turki | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Shaip | Kontak Kontak | ||||
Vietnam | Kumpulan Data Audio Vietnam | 600 | 400 | 1000 | Utara (misalnya, Hanoi), Tengah, dan Selatan (misalnya, Kota Ho Chi Minh). | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Shaip | Kontak Kontak | |||
Hindi | Kumpulan Data Audio Hindi | 800 | 2000 | 2800 | Bahasa Hindi di India khususnya di wilayah Utara, Timur dan Barat | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Shaip | Kontak Kontak | |||
Bahasa inggris | Kumpulan Data Audio Bahasa Inggris India | 300 | 500 | 800 | Dikumpulkan dari kota-kota perkotaan India yang merupakan pusat keuangan negara karena peluang ekonomi yang berkembang. Tempat-tempat tersebut dapat berupa Noida, Delhi, Dehradun, Chandigarh, Mumbai, Kolkata, Bangalore, Pune, Chennai, Hyderabad, dll. | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Shaip | Kontak Kontak | |||
Inggris | Kumpulan Data Audio Bahasa Inggris | 700 | 700 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Shaip | Kontak Kontak | |||||
kannada | Kumpulan Data Audio Kannada | 60 | 100 | 40 | 200 | Kannada dari Karnataka, India | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Shaip | Kontak Kontak | ||
Malayalam | Kumpulan Data Audio Malayalam | 60 | 100 | 40 | 200 | Malayalam dari Kerala, Lakshadweep dan Puducherry | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Shaip | Kontak Kontak | ||
Oriya | Kumpulan Data Audio Oriya | 60 | 100 | 40 | 200 | Oriya dari bagian Odisha, Benggala Barat, Jharkhand dan Chhattisgarh | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Shaip | Kontak Kontak | ||
punjabi | Kumpulan Data Audio Punjabi | 60 | 100 | 40 | 200 | Punjabi dari Punjab, India | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Shaip | Kontak Kontak | ||
Tamil | Kumpulan Data Audio Tamil | 60 | 100 | 240 | 400 | Tamil dari Tamil Nadu, India | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Shaip | Kontak Kontak | ||
telugu | Kumpulan Data Audio Telugu | 100 | 950 | 950 | 2000 | Telugu dari Andhra Pradesh, India | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Shaip | Kontak Kontak | ||
Benggala | Kumpulan Data Audio Bengali | 60 | 100 | 40 | 200 | Bengali dari Benggala Barat, India | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Shaip | Kontak Kontak | ||
gujarati | Kumpulan Data Audio Gujarat | 60 | 100 | 40 | 200 | Gujarati dari Gujarat, India | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Shaip | Kontak Kontak | ||
Marathi | Kumpulan Data Audio Marathi | 60 | 100 | 40 | 200 | Marathi dari Maharashtra, India | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Shaip | Kontak Kontak | ||
Assamese | Kumpulan Data Audio Assam | 60 | 100 | 40 | 200 | Assam dari Asssam, India | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Shaip | Kontak Kontak |
Keahlian mendalam dalam AI Percakapan
AI percakapan atau Chatbots atau Asisten Virtual / Digital hanya secerdas teknologi dan data di belakangnya. Di Shaip, kami menawarkan kepada Anda kumpulan dataset audio yang beragam untuk Natural Language Processing (NLP) yang meniru percakapan dengan orang sungguhan yang memungkinkan Anda menghidupkan AI Anda. Dengan pemahaman mendalam kami, kami membantu Anda membangun dan melokalkan model ucapan berkemampuan AI, dengan presisi tertinggi dengan kumpulan data yang kaya dan terstruktur dalam berbagai bahasa dari seluruh dunia. Kami menawarkan koleksi audio multi-bahasa, transkripsi audio, dan layanan anotasi audio berdasarkan kebutuhan Anda, sambil sepenuhnya menyesuaikan maksud, ucapan, dan distribusi demografis yang diinginkan.
Koleksi Pidato Naskah
Koleksi Pidato Spontan
Transkripsi Data Audio
Pelabelan & Anotasi Data
Shaip memungkinkan Anda melatih Platform AI Percakapan Anda secara akurat sehingga dapat:
- Berbicara, mengirim pesan, dan mengobrol dengan lancar di berbagai saluran.
- Belajar dari interaksi yang ada dalam bentuk chat, transkrip suara, transaksi, dll dan menyarankan & berkomunikasi, berdasarkan pembelajaran tersebut.
- Memahami maksud di balik ucapan manusia dan menghilangkan ambiguitas dalam memahami bahasa manusia.
- Berinteraksi dengan Anda secara pribadi dan dapat dilatih untuk mengidentifikasi pengguna dan mengingat percakapan sebelumnya.
Pemimpin Dunia dalam Data Pelatihan AI Percakapan
Jam data audio dalam 100+ bahasa – Bersumber, Ditranskripsi & Beranotasi
Lisensi Data Ucapan​
20rb+ jam Data Pidato dalam 40+ bahasa dan dialek yang mencakup 55+ topik dari berbagai domain yaitu, Pusat panggilan, Debat, Percakapan umum, Pidato, podcast, dll.
Pengumpulan Data Ucapan
Kumpulkan data audio & ucapan (monolog, percakapan 2 orang, obrolan bot manusia) dalam lebih dari 100 bahasa dari seluruh dunia, yang disesuaikan dengan kebutuhan AI Anda.
Transkripsi Data Ucapan
Transkripsi audio atau anotasi audio yang hemat biaya melalui tenaga kerja yang kuat dari 30,000 kolaborator dengan TAT, akurasi, dan penghematan yang terjamin
Percepat pengembangan aplikasi AI Percakapan Anda dengan Koleksi Audio & Layanan Anotasi Audio
Keuntungan Shaip
skala
Kami dapat mencari, menskalakan, dan mengirimkan data audio dari seluruh dunia dalam berbagai bahasa dan dialek berdasarkan kebutuhan Anda.
Keahlian
Kami memiliki keahlian yang tepat terkait pengumpulan data, transkripsi, dan anotasi standar yang akurat dan tidak memihak.
jaringan
Jaringan dengan 30,000+ kontributor yang memenuhi syarat, yang dapat dengan cepat diberi tugas pengumpulan data untuk membangun model pelatihan AI & layanan peningkatan.
Teknologi
Kami memiliki platform berbasis AI sepenuhnya dengan alat & proses berpemilik untuk memanfaatkan manajemen alur kerja 24*7 sepanjang waktu.
Kelincahan
Kami beradaptasi dengan perubahan kebutuhan pelanggan dengan sangat cepat dan membantu mempercepat pengembangan AI dengan data ucapan berkualitas 5-10x lebih cepat dari pesaing.
Security
Kami sangat mementingkan keamanan dan privasi data dan juga bersertifikat untuk menangani data sensitif yang sangat diatur.
Apa yang Kami Lakukan Terbaik
Data pelatihan
Dapatkan data berlabel kualitas tertinggi dalam waktu singkat. Ini standar emas, andal, dan siap untuk melatih model AI dan ML Anda untuk mencapai tingkat kinerja tertinggi.
Pengumpulan Data, Pelabelan & Anotasi
Dengan Shaip, Anda mendapatkan 15+ tahun keahlian yang telah terbukti dalam mengumpulkan, menyalin, dan membuat anotasi data berkualitas. Dengan tenaga kerja global kami, kami dapat mengumpulkan data dari seluruh dunia, kemudian memberikan layanan pelabelan dan anotasi dengan tingkat keterampilan dan keahlian yang diperlukan untuk data Anda.
Katalog & Lisensi Data
Dengan inventaris jutaan kumpulan data kami yang sangat besar, Anda dapat mengumpulkan dan mengatur sesuai kebutuhan. Kami kemudian dapat melisensikan data berkualitas tersebut untuk persyaratan penggunaan AI dan ML spesifik Anda. Selain itu, data ini tersedia dengan biaya yang lebih murah jika Anda membuatnya sendiri.
Ingin membuat kumpulan data Anda sendiri?
Hubungi kami sekarang untuk mempelajari bagaimana kami dapat mengumpulkan kumpulan data khusus untuk solusi AI unik Anda.