Layanan Pengumpulan Data Pidato Paling Tepercaya untuk AI Anda
Latih model NLP, VA, prototipe TTS Anda, dan lainnya dengan data percakapan berkualitas, dengan layanan pengumpulan data audio dan ucapan kami
Temukan saluran data audio tanpa hambatan
Klien Unggulan
Layanan Pengumpulan Data Audio / Suara Profesional
Mata pelajaran apa saja. Skenario apa pun.
Di Shaip, keahlian kami terletak pada pembuatan kumpulan data ucapan berkualitas tinggi yang dirancang untuk beragam kebutuhan AI/ML. Kami menawarkan beragam bahasa dan rekaman dalam beragam pengaturan sehingga menjadikan kumpulan data kami komprehensif dan mudah beradaptasi. HAIFokus kami adalah memberikan model dengan volume data ucapan khusus tertinggi, dalam waktu sesingkat mungkin. Bersama kami, Anda dapat mengharapkan:
- Data audio/suara multibahasa berkualitas tinggi untuk meningkatkan akurasi
- Tingkat kekhususan domain setinggi mungkin untuk tmenargetkan skenario yang beragam penyiapan
- Skalakan model ML Anda agar sesuai dengan demografi dan vertikal yang beragam
- Lingkungan Perekaman: Kualitas Studio, menampilkan audio sejernih kristal dengan kebisingan latar belakang minimal, & Lingkungan Alam, di mana rekaman menggabungkan suara sekitar untuk meniru situasi dunia nyata.
100 +
55K +
Data Jam Pidato
250 +
Proyek
60 +
Bahasa (100+ Dialek)
8 / 16 / 44 / 48 kHz
Sampling rate
Keahlian kami
Sejajarkan Data Audio untuk Model NLP yang Lebih Cerdas
Shaip menawarkan layanan pengumpulan data ucapan/audio end-to-end dalam lebih dari 100 bahasa untuk memungkinkan teknologi yang diaktifkan suara untuk melayani beragam audiens di seluruh dunia. Kami dapat mengerjakan proyek dengan cakupan dan ukuran apa pun; mulai dari melisensikan kumpulan data audio siap pakai yang ada, hingga mengelola pengumpulan data audio khusus, hingga transkripsi dan anotasi audio. Tidak peduli seberapa besar proyek pengumpulan data ucapan Anda, kami dapat menyesuaikan layanan pengumpulan audio agar sesuai dengan kebutuhan Anda untuk membangun kumpulan data NLP berkualitas tinggi yang menargetkan dialek, nada, dan bahasa. Pilih dari berbagai kumpulan data ucapan dan sumber pengumpulan data audio kami, untuk penyiapan cerdas yang mengaktifkan suara.
Naskah Monolog & Pidato Spontan
Ini berfokus pada pemrosesan ucapan dari satu pembicara. Memanfaatkan perintah bernaskah untuk dimasukkan ke dalam file audio saluran tunggal, memastikan tertangkapnya pola bicara, nada, dan nuansa unik yang spesifik untuk individu tersebut.
Dialog Bernaskah & Pidato Spontan
Interaksi dua orang, mereplikasi percakapan dan dialog dunia nyata dengan paparan multibahasa melalui file saluran ganda dan sumber daya yang ditranskripsikan.
Grup / Muti-partai
Percakapan
Diskusi multi-orang, menangkap dinamika kelompok, tumpang tindih, dan nada yang bervariasi untuk melatih model ucapan secara akurat.
Kumpulan Kata Bangun / Frasa Kunci / Ucapan
Latih AI untuk mengidentifikasi frasa kunci atau kata-kata atau ucapan yang memiliki makna serupa menggunakan ucapan yang beragam, kaya, dan autentik untuk pemrosesan dan pemahaman bahasa alami tingkat lanjut.
Data Akustik
Koleksi
Kami dapat merekam data audio berkualitas studio secara profesional baik itu restoran, kantor, atau rumah atau dari berbagai lingkungan dan bahasa, sekaligus mencakup jangkauan akustik yang lebih luas (Comprehensive Sound Datasets).
Pengenalan Ucapan Otomatis (ASR)
Tingkatkan akurasi sistem pengenalan ucapan otomatis (ASR) Anda dengan memiliki akses ke kumpulan data ucapan/audio yang terdiversifikasi, dari beragam demografi.
Data Pelatihan Pidato/Audio Multibahasa
Profesional bahasa kami yang ahli di seluruh dunia menawarkan data audio/ucapan multibahasa dalam berbagai bahasa dan dialek. Upaya ini mendorong komunikasi global dan menjembatani hambatan bahasa, sehingga berkontribusi terhadap solusi AI yang lebih inklusif dan efektif.
Text-to-Speech
(TTS)
Bangun model multibahasa text-to-speech (TTS) dengan bantuan tenaga kerja global kami, yang membantu Anda mengumpulkan data ucapan dalam 150+ bahasa & dialek untuk menyempurnakan model AI Anda mulai dari kontrol dalam mobil hingga chatbots dan solusi pembelajaran dengan kemampuan tinggi data audio berkualitas.
call Center
Percakapan
Pertukaran asli antara agen dan klien, mendukung berbagai bahasa seperti Spanyol, Jerman, Inggris Amerika, Bengali, Jepang, Cina, dan Hindi.
Kisah Sukses
Kumpulan data AI percakapan dengan lebih dari 3 ribu jam data dalam 8 bahasa
Ingin membangun platform multibahasa untuk bahasa India, klien bermitra dengan Shaip untuk mengumpulkan, mengelompokkan, dan menyalin kumpulan data besar dalam berbagai bahasa India. Hal ini akan membantu mengembangkan model ucapan efektif yang dapat mendukung platform baru klien yang inovatif.
Masalah: Lebih dari 3,000 jam data audio dikumpulkan dalam 8 bahasa India, disegmentasi dan ditranskripsi untuk mengembangkan pengenalan ucapan otomatis.
Larutan: Kami menyediakan pengumpulan data, segmentasi, transkripsi, dan mengirimkan file JSON dengan metadata. Kami mengumpulkan 3000 jam data audio dalam 8 bahasa India dalam skala besar untuk proyek teknologi ucapan klien.
Alasan memilih Shaip sebagai Mitra Pengumpul Data Pidato Tepercaya Anda
Konsultan Ahli
Tim yang berdedikasi dan terlatih:
- 30,000+ kolaborator untuk Pembuatan Data, Pelabelan & QA
- Tim Manajemen Proyek Terpercaya
- Tim Pengembangan Produk Berpengalaman
- Tim Sumber & Orientasi Pangkalan Bakat
Proses
Efisiensi proses tertinggi dijamin dengan:
- Proses Gerbang Panggung 6 Sigma yang Kuat
- Tim khusus yang terdiri dari sabuk hitam 6 Sigma – Pemilik proses utama & Kepatuhan kualitas
- Perbaikan Berkelanjutan & Putaran Umpan Balik
Platform
Platform yang dipatenkan menawarkan manfaat:
- Platform ujung ke ujung berbasis web
- Kualitas Sempurna
- TAT lebih cepat
- Pengiriman Mulus
Konsultan Ahli
Tim yang berdedikasi dan terlatih:
- 30,000+ kolaborator untuk Pembuatan Data, Pelabelan & QA
- Tim Manajemen Proyek Terpercaya
- Tim Pengembangan Produk Berpengalaman
- Tim Sumber & Orientasi Pangkalan Bakat
Proses
Efisiensi proses tertinggi dijamin dengan:
- Proses Gerbang Panggung 6 Sigma yang Kuat
- Tim khusus yang terdiri dari sabuk hitam 6 Sigma – Pemilik proses utama & Kepatuhan kualitas
- Perbaikan Berkelanjutan & Putaran Umpan Balik
Platform
Platform yang dipatenkan menawarkan manfaat:
- Platform ujung ke ujung berbasis web
- Kualitas Sempurna
- TAT lebih cepat
- Pengiriman Mulus
Kumpulan Data Suara / Audio yang Tidak Tersedia
Rincian | ID Korpus (Unik) | Kata kunci | Kumpulan Data Bahasa | Kode bahasa | Tingkat Sampel | Jenis Set Data | Total Jam Audio | Deskripsi Singkat | Deskripsi kumpulan data | Audio Saluran | Platform Perekaman | APA (%) | Audio Format | Format Transkripsi | Use Case | Jumlah Pembicara | CTA |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
New York Bahasa Inggris_GC_8 | Bahasa Inggris New York | Bahasa Inggris New York | en_US | 8 kHz | Percakapan Umum | 107 | Data Percakapan Umum Bahasa Inggris New York | Percakapan telepon tanpa naskah antara dua orang. kira-kira Durasi Audio (Rentang) - 15-60 menit, | rangkap | Desktop | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Wanita 118, Pria 114, Tidak Diketahui 0 | Kontak | |
Rusia_SM_48 | Rusia | Rusia | ru-RU | 48 kHz | Monolog Bernaskah | 2,398 | Monolog Naskah Rusia | Rekaman ucapan tunggal, yang cenderung jatuh dalam rentang 5 hingga 30 detik | Mono | Aplikasi Ponsel | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Perempuan 1689 Laki-laki 1937 Tidak diketahui 214 | Kontak | |
Punjabi_MA | punjabi | Punjabi (Dalam Pipa) | punjabi | Audio Media | 40 | Punjabi (In Pipeline) Data audio media | File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit | Sumber Web | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Kontak | ||||
Punjabi_GC | punjabi | Punjabi (Dalam Pipa) | punjabi | Percakapan Umum | 100 | Punjabi (In Pipeline) Data Percakapan Umum | Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit, | Desktop | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Kontak | ||||
Punjabi_CC_8 | punjabi | Punjabi (Dalam Pipa) | punjabi | Pusat Panggilan | 60 | Data Pusat Panggilan Punjabi (In Pipeline). | Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit, | Desktop | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Kontak | ||||
Polandia Poland_SM_48 | Polandia (Polandia) | Polandia (Polandia) | pl-PL | 48 kHz | Monolog Bernaskah | 1,482 | Polandia Polandia - Monolog Bernaskah | Rekaman ucapan tunggal, yang cenderung jatuh dalam rentang 5 hingga 30 detik | Mono | Aplikasi Ponsel | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Perempuan 1324 Laki-laki 701 Tidak diketahui 24 | Kontak | |
Polandia_MA_16 | semir | semir | tolong_PL | 16 kHz | Audio Media | 269 | Audio Media Polandia | File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit | Mono | Sumber Web | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Perempuan 173 Laki-laki 354 Tidak diketahui 6 | Kontak | |
Oriya_MA | Oriya | Oriya (Dalam Pipa) | atau_IN | Audio Media | 40 | Oriya (In Pipeline) Data audio media | File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit | Sumber Web | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Kontak | ||||
Oriya_GC | Oriya | Oriya (Dalam Pipa) | atau_IN | Percakapan Umum | 100 | Oriya (In Pipeline) Data Percakapan Umum | Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit, | Desktop | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Kontak | ||||
Oriya_CC_8 | Oriya | Oriya (Dalam Pipa) | atau_IN | Pusat Panggilan | 60 | Data Pusat Panggilan Oriya (In Pipeline). | Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit, | Desktop | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Kontak | ||||
Selandia Baru_MA_16 | Bahasa Inggris Selandia Baru | Bahasa Inggris Selandia Baru | en_NZ | 16 kHz | Audio Media | 400 | Audio Media Bahasa Inggris Selandia Baru | File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit | Mono | Sumber Web | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Perempuan 367, laki-laki 678, Tidak diketahui 26 | Kontak | |
Selandia Baru_GC_8 | Bahasa Inggris Selandia Baru | Bahasa Inggris Selandia Baru | en_NZ | 8 kHz | Percakapan Umum | 148 | Data Percakapan Umum Bahasa Inggris Selandia Baru | Percakapan telepon tanpa naskah antara dua orang. kira-kira Durasi Audio (Rentang) - 15-60 menit, | rangkap | Desktop | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Perempuan 167, laki-laki 121, Tidak diketahui 4 | Kontak | |
New York Bahasa Inggris_MA_16 | Bahasa Inggris New York | Bahasa Inggris New York | en_US | 16 kHz | Audio Media | 140 | Data audio Media Inggris New York | File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit | Mono | Sumber Web | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Wanita 66, Pria 230, Tidak Diketahui 11 | Kontak | |
Skotlandia_GC_8 | Skotlandia (aksen Inggris) | Skotlandia (aksen Inggris) | id_AB | 8 kHz | Percakapan Umum | 292 | Data Percakapan Umum Skotlandia | Percakapan telepon tanpa naskah antara dua orang. kira-kira Durasi Audio (Rentang) - 15-60 menit, | rangkap | Desktop | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Perempuan 285 , Laki-laki 260, Tidak Diketahui 3 | Kontak | |
Bahasa Inggris New York_CC_8 | Bahasa Inggris New York | Bahasa Inggris New York | en_US | 8 kHz | Pusat Panggilan | 103 | Data pusat panggilan Inggris New York | Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit, | rangkap | Desktop | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Wanita 610, Pria 532, Tidak tahu 0 | Kontak | |
Belanda_SM_48 | Dutch | Dutch | nl-NL | 48 kHz | Monolog Bernaskah | 1,205 | Monolog Naskah Belanda | Rekaman ucapan tunggal, yang cenderung jatuh dalam rentang 5 hingga 30 detik | Mono | Aplikasi Ponsel | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Perempuan 1285 Laki-laki 531 Tidak diketahui 3 | Kontak | |
Meksiko_SM_48 | Spanyol (Meksiko) | Spanyol (Meksiko) | es-MX | 48 kHz | Monolog Bernaskah | 1,492 | Monolog Naskah Spanyol Meksiko | Rekaman ucapan tunggal, yang cenderung jatuh dalam rentang 5 hingga 30 detik | Mono | Aplikasi Ponsel | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Perempuan 1016 Laki-laki 1069 Tidak diketahui 95 | Kontak | |
Marathi_MA | Marathi | Marathi (Dalam Jalur Pipa) | Tuan_IN | Audio Media | 40 | Marathi (In Pipeline) Data audio media | File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit | Sumber Web | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Kontak | ||||
Marathi_GC | Marathi | Marathi (Dalam Jalur Pipa) | Tuan_IN | Percakapan Umum | 100 | Marathi (In Pipeline) Data Percakapan Umum | Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit, | Desktop | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Kontak | ||||
Marathi_CC_8 | Marathi | Marathi (Dalam Jalur Pipa) | Tuan_IN | Pusat Panggilan | 60 | Data Pusat Panggilan Marathi (In Pipeline). | Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit, | Desktop | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Kontak | ||||
Malayalam_MA | Malayalam | Malayalam (Dalam Pipa) | ml_IN | Audio Media | 40 | Malayalam (In Pipeline) Data audio media | File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit | Sumber Web | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Kontak | ||||
Malayalam_GC | Malayalam | Malayalam (Dalam Pipa) | ml_IN | Percakapan Umum | 100 | Malayalam (In Pipeline) Data Percakapan Umum | Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit, | Desktop | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Kontak | ||||
Malayalam_CC_8 | Malayalam | Malayalam (Dalam Pipa) | ml_IN | Pusat Panggilan | 60 | Data Call-Center Malayalam (In Pipeline). | Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit, | Desktop | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Kontak | ||||
Melayu_MA_16 | Malay | Malay | ms_MY | 16 kHz | Audio Media | 344 | Data audio Media Melayu | File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit | Mono | Sumber Web | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Wanita 236, Pria 626, Tidak Diketahui 47 | Kontak | |
Melayu_GC_8 | Malay | Malay | ms_MY | 8 kHz | Percakapan Umum | 266 | Data Percakapan Umum Bahasa Melayu | Percakapan telepon tanpa naskah antara dua orang. kira-kira Durasi Audio (Rentang) - 15-60 menit, Melayu di Malaysia | rangkap | Desktop | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Perempuan 316, Laki-laki 176 , Tidak diketahui 0 | Kontak | |
Telugu_GC_8 | telugu | telugu | te_IN | 8 kHz | Percakapan Umum | 553 | Data Percakapan Umum Telugu | Percakapan telepon tanpa naskah antara dua orang. kira-kira Durasi Audio (Rentang) - 15-60 menit, | rangkap | Desktop | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Wanita 574 , Pria 564, Tidak diketahui 0 | Kontak | |
Inggris Inggris_WW_16 | Inggris Inggris | Inggris Inggris | en_uk | 16 kHz | Bangun Word | 200 Pembicara | Bangun Kata UK Inggris | pengumpulan data kata kunci
| Channel 1 | Aplikasi Ponsel | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Jenis Kelamin: 50% laki-laki, 50% perempuan, +/- 10%. | Kontak | |
Welsh_GC_8 | Welsh (aksen Inggris) | Welsh (aksen Inggris) | en_WL | 8 kHz | Percakapan Umum | 278 | Data Percakapan Umum Welsh | Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit, | rangkap | Desktop | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Wanita 270, Pria 324, Tidak Diketahui 0 | Kontak | |
Vietnam_MA_16 | Vietnam | Vietnam | vi_VN | 16 kHz | Audio Media | 257 | Data audio Media Vietnam | File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit | Mono | Sumber Web | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Perempuan 249, laki-laki 200, Tidak diketahui 45 | Kontak | |
Vietnam_GC_8 | Vietnam | Vietnam | vi_VN | 8 kHz | Percakapan Umum | 295 | Data Percakapan Umum Vietnam | Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit, Utara (misalnya,Hanoi), Tengah, dan Selatan (misalnya, Kota Ho Chi Minh). | rangkap | Desktop | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Perempuan 400, laki-laki 380, Tidak diketahui 2 | Kontak | |
Turki Turki_SM_48 | Turki Turki | Turki Turki | tr-TR | 48 kHz | Monolog Bernaskah | 2,027 | Turki Turki | Rekaman ucapan tunggal, yang cenderung jatuh dalam rentang 5 hingga 30 detik | Mono | Aplikasi Ponsel | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Perempuan 1561 Laki-laki 1241 Tidak diketahui 31 | Kontak | |
Thailand_MA_8 | Thailand | Thailand | th_TH | 16 kHz | Audio Media | 173 | Audio Media Thailand | File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit | Mono | Sumber Web | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Wanita 143, Pria 502, Tidak Diketahui 26 | Kontak | |
Thailand_GC_8 | Thailand | Thailand | th_TH | 8 kHz | Percakapan Umum | 183 | Percakapan Umum Thailand | Percakapan telepon tanpa naskah antara dua orang. kira-kira Durasi Audio (Rentang) - 15-60 menit, Sebuah register informal yang digunakan antara teman-teman | rangkap | Desktop | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Wanita 338, Pria 96, Tidak Diketahui 8 | Kontak | |
Telugu_MA | telugu | Telugu (Dalam Pipa) | te_IN | Audio Media | 20 | Data audio media Telugu (In Pipeline). | File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit | Sumber Web | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Kontak | ||||
Telugu_GC | telugu | Telugu (Dalam Pipa) | te_IN | Percakapan Umum | 50 | Telugu (In Pipeline) Data Percakapan Umum | Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit, | Desktop | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Kontak | ||||
Telugu_CC_8 | telugu | Telugu (Dalam Pipa) | te_IN | Pusat Panggilan | 30 | Data Pusat Panggilan Telugu (In Pipeline). | Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit, | Desktop | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Kontak | ||||
Telugu_MA_16 | telugu | telugu | te_IN | 16 kHz | Audio Media | 648 | Data audio Media Telugu | File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit | Mono | Sumber Web | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Wanita 207, Pria 963, Tidak Diketahui 2 | Kontak | |
Korea_SM_48 | Korea | Korea | ko-KR | 48 kHz | Monolog Bernaskah | 1,955 | Monolog Bernaskah Korea | Rekaman ucapan tunggal, yang cenderung jatuh dalam rentang 5 hingga 30 detik | Mono | Aplikasi Ponsel | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Perempuan 1195 Laki-laki 1134 Tidak diketahui 122 | Kontak | |
Tamil_MA | Tamil | Tamil (Dalam Pipa) | ta_IN | Audio Media | 40 | Tamil (In Pipeline) Data audio media | File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit | Sumber Web | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Kontak | ||||
Tamil_GC | Tamil | Tamil (Dalam Pipa) | ta_IN | Percakapan Umum | 100 | Data Percakapan Umum Tamil (In Pipeline). | Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit, | Desktop | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Kontak | ||||
Tamil_CC_8 | Tamil | Tamil (Dalam Pipa) | ta_IN | Pusat Panggilan | 60 | Data Pusat Panggilan Tamil (In Pipeline). | Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit, | Desktop | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Kontak | ||||
Swedia_MA_16 | Swedia | Swedia | sv_SE | 16 kHz | Audio Media | 278 | Data audio Media Swedia | File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit | Mono | Sumber Web | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Perempuan 195, laki-laki 500, Tidak Diketahui 21 | Kontak | |
Swedia_CC_8 | Swedia | Swedia | sv_SE | 8 kHz | Pusat Panggilan | 250 | Data Pusat Panggilan Swedia | Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit, | rangkap | Desktop | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Perempuan 1581, laki-laki 727, Tidak Diketahui 2 | Kontak | |
Swahili_MA_16 | swahili | swahili | sw_KE | 16 kHz | Audio Media | 265 | Data audio Media Swahili | File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit | Mono | Sumber Web | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Wanita 118, Pria 493, Tidak Diketahui 25 | Kontak | |
Swahili_CC_8 | swahili | swahili | sw_KE | 8 kHz | Pusat Panggilan | 230 | Data Pusat Panggilan Swahili | Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit, | rangkap | Desktop | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Wanita 611, Pria 833, Tidak Diketahui 0 | Kontak | |
Bahasa Inggris Afrika Selatan_MA_16 | Bahasa Inggris Afrika Selatan | Bahasa Inggris Afrika Selatan | en_ZA | 16 kHz | Audio Media | 251 | Data audio Media Inggris Afrika Selatan | File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit | Mono | Sumber Web | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Wanita 235, Pria 432, Tidak Diketahui 36 | Kontak | |
Inggris Afrika Selatan_CC_8 | Bahasa Inggris Afrika Selatan | Bahasa Inggris Afrika Selatan | en_ZA | 8 kHz | Pusat Panggilan | 261 | Data Pusat Panggilan Bahasa Inggris Afrika Selatan | Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit, | rangkap | Desktop | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Wanita 1274 , Pria 935 , Tidak Diketahui 1 | Kontak | |
Singapura_MA_16 | Bahasa Inggris Singapura | Bahasa Inggris Singapura | en_SG | 16 kHz | Audio Media | 247 | Data audio Media Singapura | File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit | Mono | Sumber Web | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Wanita 160, Pria 455, Tidak Diketahui 37 | Kontak | |
Singapura_CC_8 | Bahasa Inggris Singapura | Bahasa Inggris Singapura | en_SG | 8 kHz | Pusat Panggilan | 218 | Data Pusat Panggilan Singapura | Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit, | rangkap | Desktop | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Wanita 2139 , Pria 884, Tidak diketahui 21 | Kontak | |
Boston_CC_8 | Bahasa Inggris Boston | Bahasa Inggris Boston | en_US | 8 kHz | Pusat Panggilan | 177 | Data pusat panggilan Boston | Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit, | rangkap | Desktop | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Wanita: 605, Pria: 711, dan Tidak Diketahui: 0 | Kontak | |
Bahasa Inggris Deep South_CC_8 | Inggris Jauh Selatan | Inggris Jauh Selatan | en_US | 8 kHz | Pusat Panggilan | 151 | Data pusat panggilan Deep South Inggris | Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit, | rangkap | Desktop | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Perempuan 221 , Laki-laki 1004 , Tidak diketahui 7 | Kontak | |
Denmark_SM_48 | Denmark | Denmark | da-DK | 48 kHz | Monolog Bernaskah | 2,579 | Monolog Naskah Denmark | Rekaman ucapan tunggal, yang cenderung jatuh dalam rentang 5 hingga 30 detik, Denmark dari Denmark | Mono | Aplikasi Ponsel | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Perempuan 1551 Laki-laki 1233 Tidak diketahui 42 | Kontak | |
Denmark_MA_16 | Denmark | Denmark | da_DK | 16 kHz | Audio Media | 664 | Data audio Media Denmark | File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit | Mono | Sumber Web | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Wanita: 369, Pria: 864, Tidak diketahui: 27 | Kontak | |
Denmark_GC_8 | Denmark | Denmark | da_DK | 8 kHz | Percakapan Umum | 372 | Data Percakapan Umum Denmark | Percakapan telepon tanpa naskah antara dua orang. kira-kira Durasi Audio (Rentang) - 15-60 menit, | rangkap | Desktop | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Wanita: 311, Pria: 417, Tidak diketahui: 0 | Kontak | |
Tradisional Cina_SM_48 | Cina Tradisional | Cina Tradisional | zh-TW | 48 kHz | Monolog Bernaskah | 1,028 | Cina Tradisional | Rekaman ucapan tunggal, yang cenderung jatuh dalam rentang 5 hingga 30 detik | Mono | Aplikasi Ponsel | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Perempuan 1069 Laki-laki 262 Tidak diketahui 3 | Kontak | |
Cina Sederhana_SM_48 | Cina Sederhana | Cina Sederhana | zh-CN | 48 kHz | Monolog Bernaskah | 2,762 | Cina Sederhana | Rekaman ucapan tunggal, yang cenderung jatuh dalam rentang 5 hingga 30 detik | Mono | Aplikasi Ponsel | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Perempuan 1920 Laki-laki 1535 Tidak diketahui 270 | Kontak | |
Cina_MA_16 | Bahasa Inggris Mandarin | Bahasa Inggris Mandarin | en_US | 16 kHz | Audio Media | 249 | Data audio Media Cina | File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit | Mono | Sumber Web | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Wanita: 126, Pria: 346 dan Tidak Diketahui: 6 | Kontak | |
Cina_CC_8 | Bahasa Inggris Mandarin | Bahasa Inggris Mandarin | en_US | 8 kHz | Pusat Panggilan | 169 | Data pusat panggilan Cina | Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit, | rangkap | Desktop | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Wanita: 1790, Pria: 523 dan Tidak Diketahui: 13 | Kontak | |
Kanada_SM_48 | Perancis Kanada | Perancis Kanada | fr-CA | 48 kHz | Monolog Bernaskah | 1,222 | Perancis Kanada | Rekaman ucapan tunggal, yang cenderung jatuh dalam rentang 5 hingga 30 detik | Mono | Aplikasi Ponsel | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Perempuan 974 Laki-laki 631 Tidak diketahui 1 | Kontak | |
Boston_MA_16 | Bahasa Inggris Boston | Bahasa Inggris Boston | en_US | 16 kHz | Audio Media | 93 | Data audio Boston Media | File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit | Mono | Sumber Web | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Wanita: 43, Pria: 181, dan Tidak Diketahui: 2 | Kontak | |
Boston_GC_8 | Bahasa Inggris Boston | Bahasa Inggris Boston | en_US | 8 kHz | Percakapan Umum | 32 | Data Percakapan Umum Boston | Percakapan telepon tanpa naskah antara dua orang. kira-kira Durasi Audio (Rentang) - 15-60 menit, | rangkap | Desktop | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Wanita: 53, Pria: 83, dan Tidak Diketahui: 0 | Kontak | |
Bahasa Inggris Deep South_GC_8 | Inggris Jauh Selatan | Inggris Jauh Selatan | en_US | 8 kHz | Percakapan Umum | 56 | Data Percakapan Umum Deep South Inggris | Percakapan telepon tanpa naskah antara dua orang. kira-kira Durasi Audio (Rentang) - 15-60 menit, | rangkap | Desktop | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Wanita 99, Pria 31, Tidak Diketahui 0 | Kontak | |
Bengali_MA | Benggala | Bengali (Dalam Pipa) | bn_IN | Audio Media | 40 | Bengali (In Pipeline) Data audio media | File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit | Sumber Web | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Kontak | ||||
Bengali_GC | Benggala | Bengali (Dalam Pipa) | bn_IN | Percakapan Umum | 100 | Data Percakapan Umum Bengali (In Pipeline). | Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit, | Desktop | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Kontak | ||||
Bengali_CC_8 | Benggala | Bengali (Dalam Pipa) | bn_IN | Pusat Panggilan | 60 | Data Pusat Panggilan Bengali (In Pipeline). | Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit, | Desktop | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Kontak | ||||
Assam_MA | Assamese | Assam (Dalam Pipa) | seperti dalam | Audio Media | 40 | Data audio media Assam (In Pipeline). | File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit | Sumber Web | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Kontak | ||||
Assam_GC | Assamese | Assam (Dalam Pipa) | seperti dalam | Percakapan Umum | 100 | Data Percakapan Umum Assam (In Pipeline). | Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit, | Desktop | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Kontak | ||||
Assam_CC_8 | Assamese | Assam (Dalam Pipa) | seperti dalam | Pusat Panggilan | 60 | Data Pusat Panggilan Assam (In Pipeline). | Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit, | Desktop | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Kontak | ||||
Arab_SM_48 | Arab | Arab | ar-SA | 48 kHz | Monolog Bernaskah | 1,947 | Monolog Bertulisan Arab | Rekaman ucapan tunggal, yang cenderung jatuh dalam rentang 5 hingga 30 detik | Mono | Aplikasi Ponsel | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Perempuan 838 Laki-laki 1209 Tidak diketahui 78 | Kontak | |
Arab_GC_8 | Arab | Arab | ar_AE | 8 kHz | Percakapan Umum | 292 | Data Percakapan Umum Bahasa Arab | Percakapan telepon tanpa naskah antara dua orang. kira-kira Durasi Audio (Rentang) - 15-60 menit, Arab dari negara-negara Teluk | rangkap | Desktop | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Wanita: 171, Pria: 534, dan Tidak Diketahui: 1 | Kontak | |
Afrikaans_MA_16 | Afrikanas | Afrikanas | af_ZA | 16 kHz | Audio Media | 658 | File Media Afrikaans | File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit | Mono | Sumber Web | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Wanita: 750, Pria: 1278, dan Tidak Diketahui: 52 | Kontak | |
Afrikaans_GC_8 | Afrikanas | Afrikanas | af_ZA | 8 kHz | Percakapan Umum | 368 | Data Percakapan Umum Afrika | Percakapan telepon tanpa naskah antara dua orang. kira-kira Durasi Audio (Rentang) - 15-60 menit, Bahasa Afrikaans diucapkan di Afrika | rangkap | Desktop | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Wanita: 502, Pria: 390, dan Tidak Diketahui: 2 | Kontak | |
id_US_MA_16 | Bahasa Afrika Amerika American | Bahasa Afrika Amerika American | en_US | 16 kHz | Audio Media | 154 | Data Media Vernakular Afrika-Amerika | File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit | Mono | Sumber Web | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Wanita: 151, Pria: 150, dan Tidak Diketahui: 10 | Kontak | |
HINGLISH_MA_16 | Bahasa inggris | Bahasa inggris | hg_IN | 16 kHz | Audio Media | 216 | Data audio media | File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit | Mono | Sumber Web | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Wanita 75, Pria 380, Tidak Diketahui 0 | Kontak | |
korea_MA_16 | Korea | Korea | ko_kr | 16 kHz | Audio Media | 204 | Data audio media Korea | File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit | Mono | Sumber Web | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Perempuan 70 Laki-laki 303, Tidak diketahui 25 | Kontak | |
Korea_CC_8 | Korea | Korea | ko_kr | 8 kHz | Pusat Panggilan | 107 | Data pusat panggilan Korea | Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit, | rangkap | Desktop | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Perempuan 1086, Laki-laki 210 , Tidak diketahui 4 | Kontak | |
Kannada_MA | kannada | Kannada (Dalam Pipa) | kn_IN | Audio Media | 40 | Kannada (In Pipeline) Data audio media | File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit | Sumber Web | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Kontak | ||||
Kannada_GC | kannada | Kannada (Dalam Pipa) | kn_IN | Percakapan Umum | 100 | Kannada (In Pipeline) Data Percakapan Umum | Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit, | Desktop | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Kontak | ||||
Kannada_CC_8 | kannada | Kannada (Dalam Pipa) | kn_IN | Pusat Panggilan | 60 | Data Pusat Panggilan Kannada (In Pipeline). | Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit, | Desktop | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Kontak | ||||
Jepang_SM_48 | Jepang | Jepang | ja-JP | 48 kHz | Monolog Bernaskah | 2,335 | Monolog Naskah Jepang | Rekaman ucapan tunggal, yang cenderung jatuh dalam rentang 5 hingga 30 detik | Mono | Aplikasi Ponsel | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Perempuan 1460 Laki-laki 1221 Tidak diketahui 194 | Kontak | |
Irlandia_GC_8 | Irlandia | Irlandia | en_IE | 8 kHz | Percakapan Umum | 192 | Data Percakapan Umum Irlandia | Percakapan telepon tanpa naskah antara dua orang. kira-kira Durasi Audio (Rentang) - 15-60 menit, | rangkap | Desktop | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Wanita 213 , Pria 153 , Tidak Diketahui 0 | Kontak | |
Indonesia_MA_16 | Indonesia | Indonesia | aku melakukannya | 16 kHz | Audio Media | 643 | Data audio Media Indonesia | File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit | Mono | Sumber Web | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Wanita 746, Pria 1507, Tidak Diketahui 129 | Kontak | |
Indonesia_GC_8 | Indonesia | Indonesia | aku melakukannya | 8 kHz | Percakapan Umum | 496 | Data Percakapan Umum Bahasa Indonesia | Percakapan telepon tanpa naskah antara dua orang. kira-kira Durasi Audio (Rentang) - 15-60 menit, Bahasa Indonesia | rangkap | Desktop | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Wanita 524, Pria 454, Tidak Diketahui 2 | Kontak | |
Hispanik_MA_16 | Bahasa Inggris Hispanik | Bahasa Inggris Hispanik | en_US | 16 kHz | Audio Media | 155 | Audio Media Panggilan Hispanik | File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit | Mono | Sumber Web | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Wanita 140, Pria 219, Tidak Diketahui 5 | Kontak | |
Hispanik_CC_8 | Bahasa Inggris Hispanik | Bahasa Inggris Hispanik | en_US | 8 kHz | Pusat Panggilan | 212 | Data pusat panggilan Hispanik | Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit, | rangkap | Desktop | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Wanita 822, Pria 1262, Tidak Diketahui 0 | Kontak | |
id_US_CC_8 | Bahasa Afrika Amerika American | Bahasa Afrika Amerika American | en_US | 8 kHz | Pusat panggilan | 211 | Data pusat panggilan Vernakular Afrika-Amerika | Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit, | rangkap | Desktop | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Wanita: 612, Pria: 1242, dan Tidak Diketahui: 12 | Kontak | |
HINGLISH_CC_8 | Bahasa inggris | Bahasa inggris | hg_IN | 8 kHz | Pusat Panggilan | 208 | Data pusat panggilan | Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit, | rangkap | Desktop | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Wanita 822, Pria 1262 , Tidak diketahui 0 | Kontak | |
Hindi_SM_48 | Hindi | Hindi | hi-IN | 48 kHz | Monolog Bernaskah | 2,867 | Monolog Bernaskah Hindi | Rekaman ucapan tunggal, yang cenderung jatuh dalam rentang 5 hingga 30 detik | Mono | Aplikasi Ponsel | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Perempuan 1977 Laki-laki 1864 Tidak diketahui 147 | Kontak | |
Hindi_MA_16 | Hindi | Hindi | hai_IN | 16 kHz | Audio Media | 219 | Data audio Media Hindi | File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit | Mono | Sumber Web | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Perempuan 83 , Laki-laki 309, Tidak Diketahui 0 | Kontak | |
Ibrani_MA_16 | Ibrani | Ibrani | dia_IL | 16 kHz | Audio Media | 427 | Data audio Media Ibrani | File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit | Mono | Sumber Web | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Perempuan 361 , Laki-laki 513, Tidak Diketahui 13 | Kontak | |
Ibrani_Percakapan Umum_8 | Ibrani | Ibrani | dia_IL | 8 kHz | Percakapan Umum | 399 | Data Percakapan Umum Bahasa Ibrani | Percakapan telepon tanpa naskah antara dua orang. kira-kira Durasi Audio (Rentang) - 15-60 menit, Ibrani di Israel | rangkap | Desktop | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Wanita 414 , Pria 399 , Tidak diketahui 1 | Kontak | |
Gujarati_MA | gujarati | Gujarati (Dalam Pipa) | gu_IN | Audio Media | 40 | Gujarati (In Pipeline) Data audio media | File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit | Sumber Web | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Kontak | ||||
Gujarati_GC | gujarati | Gujarati (Dalam Pipa) | gu_IN | Percakapan Umum | 100 | Gujarati (In Pipeline) Data Percakapan Umum | Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit, | Desktop | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Kontak | ||||
Gujarati_CC_8 | gujarati | Gujarati (Dalam Pipa) | gu_IN | Pusat Panggilan | 60 | Data Pusat Panggilan Gujarati (In Pipeline). | Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit, | Desktop | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Kontak | ||||
Jerman_IVR_8 | Jerman | Jerman | de-De | 8 kHz | IVR | 200 | Data IVR Jerman | Manusia ke Mesin. Jenis aliran IVR di mana ada prompt TTS (mis. "Bagaimana saya bisa membantu Anda") diikuti oleh respons spontan manusia | Mono | Desktop | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Perempuan 10115 Laki-laki 8750 Tidak diketahui 0 | Kontak | ||
Jerman_CC_8 | Jerman | Jerman | de-De | 8 kHz | Pusat Panggilan | 64 | Data pusat panggilan Jerman | Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit, | Mono | Desktop | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Perempuan 478 Laki-laki 1440 Tidak diketahui 0 | Kontak | ||
Bahasa Inggris Deep South_MA_16 | Inggris Jauh Selatan | Inggris Jauh Selatan | en_US | 16 kHz | Audio Media | 266 | Data audio Deep South Media Inggris | File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit | Mono | Sumber Web | 5.0 | . Wav | .json | ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa | Wanita 204, Pria 356, Tidak Diketahui 21 | Kontak |
Layanan yang ditawarkan
Pengumpulan data audio ahli tidak semuanya dilakukan untuk penyiapan AI yang komprehensif. Di Shaip, Anda bahkan dapat mempertimbangkan layanan berikut untuk membuat model jauh lebih luas dari biasanya:
Pengumpulan Data Teks
Layanan
Nilai sebenarnya dari layanan pengumpulan data kognitif Shaip adalah memberikan organisasi kunci untuk membuka informasi penting yang ditemukan dalam data tidak terstruktur
Layanan Pengumpulan Data Gambar
Pastikan model visi komputer Anda mengidentifikasi setiap gambar secara akurat, untuk melatih model AI generasi mendatang dengan lancar
Layanan Pengumpulan Data Video
Sekarang fokus pada visi komputer bersama dengan NLP untuk melatih model Anda untuk mengidentifikasi objek, individu, pencegah, dan elemen visual lainnya dengan sempurna
Sumber Daya yang Direkomendasikan
Menawarkan
Anotasi Audio untuk AI Cerdas
Layanan anotasi audio telah menjadi keahlian Shaip sejak awal. Kembangkan, latih & tingkatkan AI percakapan, chatbot & mesin pengenalan suara dengan layanan anotasi audio canggih kami.
Panduan Pembeli
Panduan Pembeli: Panduan Lengkap untuk AI Percakapan
Chatbot yang Anda ajak bicara berjalan pada sistem AI percakapan canggih yang dilatih, diuji, dan dibuat menggunakan banyak kumpulan data pengenalan suara.
Katalog Data
Katalog & Lisensi Data Ucapan Siap Pakai
Ada berbagai macam aplikasi umum untuk data ucapan dalam proyek AI. Kami menawarkan sejumlah besar data berkualitas tinggi yang siap untuk pengenalan suara Anda.
Ingin membuat kumpulan data audio Anda sendiri?
Terhubung dengan pakar pengumpulan data ucapan internal kami untuk menyiapkan repositori audio yang paling sesuai dengan kebutuhan Anda
Pertanyaan yang Sering Diajukan (FAQ)
Pengumpulan Data Ucapan untuk Model ML mengacu pada proses pengumpulan rekaman audio bahasa lisan. Koleksi ini membantu dalam pelatihan dan menyempurnakan algoritme pembelajaran mesin, khususnya yang berpusat pada pemahaman dan pemrosesan suara manusia.
Saat ingin mengumpulkan data audio untuk Pengenalan Ucapan Otomatis (ASR), Anda harus mulai dengan menentukan kebutuhan spesifik proyek Anda, termasuk bahasa, aksen, dan jenis ucapan yang diinginkan. Setelah mengatur parameter ini, pastikan Anda mendapatkan semua izin yang diperlukan untuk menghormati privasi pengguna. Kemudian, gunakan alat perekam atau perangkat lunak yang sesuai untuk menangkap sampel audio yang jelas. Setiap rekaman harus diberi anotasi secara cermat beserta transkripsinya atau metadata terkait lainnya dan disimpan secara sistematis agar mudah diakses.
Kumpulan data ucapan dalam pembelajaran mesin sangat penting untuk pelatihan, pengujian, dan validasi model yang disesuaikan untuk mengenali, mentranskripsikan, atau menafsirkan bahasa lisan. Kumpulan data tersebut membuka jalan bagi berbagai aplikasi, mulai dari asisten suara dan layanan transkripsi hingga biometrik suara.
Untuk mengumpulkan data yang tepat dari beragam bahasa dan aksen, kolaborasi dengan penutur asli dari latar belakang linguistik yang diinginkan sangatlah penting. Bertujuan untuk mendapatkan sampel yang bervariasi dan representatif untuk mencakup spektrum demografi yang luas. Gunakan peralatan perekaman standar di lingkungan yang seragam untuk memastikan konsistensi audio. Dan yang terpenting, beri anotasi pada setiap bagian data dengan transkripsi dan metadata terperinci, yang menunjukkan bahasa dan aksen tertentu.