Layanan Pengumpulan Data Pidato Paling Tepercaya untuk AI Anda

Latih model NLP, VA, prototipe TTS Anda, dan lainnya dengan data percakapan berkualitas, dengan layanan pengumpulan data audio dan ucapan kami

Temukan saluran data audio tanpa hambatan

Hubungi Kami

Klien Unggulan

sebelumnya

Selanjutnya

Layanan Pengumpulan Data Audio / Suara Profesional

Mata pelajaran apa saja. Skenario apa pun.

Di Shaip, keahlian kami terletak pada pembuatan kumpulan data ucapan berkualitas tinggi yang dirancang untuk beragam kebutuhan AI/ML. Kami menawarkan beragam bahasa dan rekaman dalam beragam pengaturan sehingga menjadikan kumpulan data kami komprehensif dan mudah beradaptasi. HAIFokus kami adalah memberikan model dengan volume data ucapan khusus tertinggi, dalam waktu sesingkat mungkin. Bersama kami, Anda dapat mengharapkan:

Data audio/suara multibahasa berkualitas tinggi untuk meningkatkan akurasi
Tingkat kekhususan domain setinggi mungkin untuk tmenargetkan skenario yang beragam penyiapan

Skalakan model ML Anda agar sesuai dengan demografi dan vertikal yang beragam
Lingkungan Perekaman: Kualitas Studio, menampilkan audio sejernih kristal dengan kebisingan latar belakang minimal, & Lingkungan Alam, di mana rekaman menggabungkan suara sekitar untuk meniru situasi dunia nyata.

100 +

Negara

55K +

Data Jam Pidato

250 +

Proyek

60 +

Bahasa (100+ Dialek)

8 / 16 / 44 / 48 kHz

Sampling rate

Keahlian kami

Sejajarkan Data Audio untuk Model NLP yang Lebih Cerdas

Shaip menawarkan layanan pengumpulan data ucapan/audio end-to-end dalam lebih dari 100 bahasa untuk memungkinkan teknologi yang diaktifkan suara untuk melayani beragam audiens di seluruh dunia. Kami dapat mengerjakan proyek dengan cakupan dan ukuran apa pun; mulai dari melisensikan kumpulan data audio siap pakai yang ada, hingga mengelola pengumpulan data audio khusus, hingga transkripsi dan anotasi audio. Tidak peduli seberapa besar proyek pengumpulan data ucapan Anda, kami dapat menyesuaikan layanan pengumpulan audio agar sesuai dengan kebutuhan Anda untuk membangun kumpulan data NLP berkualitas tinggi yang menargetkan dialek, nada, dan bahasa. Pilih dari berbagai kumpulan data ucapan dan sumber pengumpulan data audio kami, untuk penyiapan cerdas yang mengaktifkan suara.

Kisah Sukses

Kumpulan data AI percakapan dengan lebih dari 3 ribu jam data dalam 8 bahasa

Ingin membangun platform multibahasa untuk bahasa India, klien bermitra dengan Shaip untuk mengumpulkan, mengelompokkan, dan menyalin kumpulan data besar dalam berbagai bahasa India. Hal ini akan membantu mengembangkan model ucapan efektif yang dapat mendukung platform baru klien yang inovatif.

Masalah: Lebih dari 3,000 jam data audio dikumpulkan dalam 8 bahasa India, disegmentasi dan ditranskripsi untuk mengembangkan pengenalan ucapan otomatis.

Larutan: Kami menyediakan pengumpulan data, segmentasi, transkripsi, dan mengirimkan file JSON dengan metadata. Kami mengumpulkan 3000 jam data audio dalam 8 bahasa India dalam skala besar untuk proyek teknologi ucapan klien.

Alasan memilih Shaip sebagai Mitra Pengumpul Data Pidato Tepercaya Anda

Konsultan Ahli

Tim yang berdedikasi dan terlatih:

30,000+ kolaborator untuk Pembuatan Data, Pelabelan & QA
Tim Manajemen Proyek Terpercaya
Tim Pengembangan Produk Berpengalaman
Tim Sumber & Orientasi Pangkalan Bakat

Proses

Efisiensi proses tertinggi dijamin dengan:

Proses Gerbang Panggung 6 Sigma yang Kuat
Tim khusus yang terdiri dari sabuk hitam 6 Sigma – Pemilik proses utama & Kepatuhan kualitas
Perbaikan Berkelanjutan & Putaran Umpan Balik

Platform

Platform yang dipatenkan menawarkan manfaat:

Platform ujung ke ujung berbasis web
Kualitas Sempurna
TAT lebih cepat
Pengiriman Mulus

Konsultan Ahli

Tim yang berdedikasi dan terlatih:

30,000+ kolaborator untuk Pembuatan Data, Pelabelan & QA
Tim Manajemen Proyek Terpercaya
Tim Pengembangan Produk Berpengalaman
Tim Sumber & Orientasi Pangkalan Bakat

Proses

Efisiensi proses tertinggi dijamin dengan:

Proses Gerbang Panggung 6 Sigma yang Kuat
Tim khusus yang terdiri dari sabuk hitam 6 Sigma – Pemilik proses utama & Kepatuhan kualitas
Perbaikan Berkelanjutan & Putaran Umpan Balik

Platform

Platform yang dipatenkan menawarkan manfaat:

Platform ujung ke ujung berbasis web
Kualitas Sempurna
TAT lebih cepat
Pengiriman Mulus

Kumpulan Data Suara / Audio yang Tidak Tersedia

ID Korpus (Unik)	Kata kunci	Kumpulan Data Bahasa	Kode bahasa	Tingkat Sampel	Jenis Set Data	Total Jam Audio	Deskripsi Singkat	Deskripsi kumpulan data	Audio Saluran	Platform Perekaman	APA (%)	Audio Format	Format Transkripsi	Use Case	Jumlah Pembicara	CTA
id_US_CC_8	Bahasa Afrika Amerika American	Bahasa Afrika Amerika American	en_US	8 kHz	Pusat panggilan	211	Data pusat panggilan Vernakular Afrika-Amerika	Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,	rangkap	Desktop	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Wanita: 612, Pria: 1242, dan Tidak Diketahui: 12	Kontak
id_US_MA_16	Bahasa Afrika Amerika American	Bahasa Afrika Amerika American	en_US	16 kHz	Audio Media	154	Data Media Vernakular Afrika-Amerika	File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit	Mono	Sumber Web	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Wanita: 151, Pria: 150, dan Tidak Diketahui: 10	Kontak
Afrikaans_GC_8	Afrikanas	Afrikanas	af_ZA	8 kHz	Percakapan Umum	368	Data Percakapan Umum Afrika	Percakapan telepon tanpa naskah antara dua orang. kira-kira Durasi Audio (Rentang) - 15-60 menit, Bahasa Afrikaans diucapkan di Afrika	rangkap	Desktop	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Wanita: 502, Pria: 390, dan Tidak Diketahui: 2	Kontak
Afrikaans_MA_16	Afrikanas	Afrikanas	af_ZA	16 kHz	Audio Media	658	File Media Afrikaans	File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit	Mono	Sumber Web	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Wanita: 750, Pria: 1278, dan Tidak Diketahui: 52	Kontak
Arab_GC_8	Arab	Arab	ar_AE	8 kHz	Percakapan Umum	292	Data Percakapan Umum Bahasa Arab	Percakapan telepon tanpa naskah antara dua orang. kira-kira Durasi Audio (Rentang) - 15-60 menit, Arab dari negara-negara Teluk	rangkap	Desktop	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Wanita: 171, Pria: 534, dan Tidak Diketahui: 1	Kontak
Arab_SM_48	Arab	Arab	ar-SA	48 kHz	Monolog Bernaskah	1,947	Monolog Bertulisan Arab	Rekaman ucapan tunggal, yang cenderung jatuh dalam rentang 5 hingga 30 detik	Mono	Aplikasi Ponsel	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Perempuan 838 Laki-laki 1209 Tidak diketahui 78	Kontak
Assam_CC_8	Assamese	Assam (Dalam Pipa)	seperti dalam		Pusat Panggilan	60	Data Pusat Panggilan Assam (In Pipeline).	Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,		Desktop	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa		Kontak
Assam_GC	Assamese	Assam (Dalam Pipa)	seperti dalam		Percakapan Umum	100	Data Percakapan Umum Assam (In Pipeline).	Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,		Desktop	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa		Kontak
Assam_MA	Assamese	Assam (Dalam Pipa)	seperti dalam		Audio Media	40	Data audio media Assam (In Pipeline).	File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit		Sumber Web	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa		Kontak
Bengali_CC_8	Benggala	Bengali (Dalam Pipa)	bn_IN		Pusat Panggilan	60	Data Pusat Panggilan Bengali (In Pipeline).	Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,		Desktop	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa		Kontak
Bengali_GC	Benggala	Bengali (Dalam Pipa)	bn_IN		Percakapan Umum	100	Data Percakapan Umum Bengali (In Pipeline).	Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,		Desktop	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa		Kontak
Bengali_MA	Benggala	Bengali (Dalam Pipa)	bn_IN		Audio Media	40	Bengali (In Pipeline) Data audio media	File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit		Sumber Web	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa		Kontak
Boston_CC_8	Bahasa Inggris Boston	Bahasa Inggris Boston	en_US	8 kHz	Pusat Panggilan	177	Data pusat panggilan Boston	Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,	rangkap	Desktop	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Wanita: 605, Pria: 711, dan Tidak Diketahui: 0	Kontak
Boston_GC_8	Bahasa Inggris Boston	Bahasa Inggris Boston	en_US	8 kHz	Percakapan Umum	32	Data Percakapan Umum Boston	Percakapan telepon tanpa naskah antara dua orang. kira-kira Durasi Audio (Rentang) - 15-60 menit,	rangkap	Desktop	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Wanita: 53, Pria: 83, dan Tidak Diketahui: 0	Kontak
Boston_MA_16	Bahasa Inggris Boston	Bahasa Inggris Boston	en_US	16 kHz	Audio Media	93	Data audio Boston Media	File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit	Mono	Sumber Web	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Wanita: 43, Pria: 181, dan Tidak Diketahui: 2	Kontak
Kanada_SM_48	Perancis Kanada	Perancis Kanada	fr-CA	48 kHz	Monolog Bernaskah	1,222	Perancis Kanada	Rekaman ucapan tunggal, yang cenderung jatuh dalam rentang 5 hingga 30 detik	Mono	Aplikasi Ponsel	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Perempuan 974 Laki-laki 631 Tidak diketahui 1	Kontak
Cina_CC_8	Bahasa Inggris Mandarin	Bahasa Inggris Mandarin	en_US	8 kHz	Pusat Panggilan	169	Data pusat panggilan Cina	Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,	rangkap	Desktop	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Wanita: 1790, Pria: 523 dan Tidak Diketahui: 13	Kontak
Cina_MA_16	Bahasa Inggris Mandarin	Bahasa Inggris Mandarin	en_US	16 kHz	Audio Media	249	Data audio Media Cina	File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit	Mono	Sumber Web	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Wanita: 126, Pria: 346 dan Tidak Diketahui: 6	Kontak
Cina Sederhana_SM_48	Cina Sederhana	Cina Sederhana	zh-CN	48 kHz	Monolog Bernaskah	2,762	Cina Sederhana	Rekaman ucapan tunggal, yang cenderung jatuh dalam rentang 5 hingga 30 detik	Mono	Aplikasi Ponsel	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Perempuan 1920 Laki-laki 1535 Tidak diketahui 270	Kontak
Tradisional Cina_SM_48	Cina Tradisional	Cina Tradisional	zh-TW	48 kHz	Monolog Bernaskah	1,028	Cina Tradisional	Rekaman ucapan tunggal, yang cenderung jatuh dalam rentang 5 hingga 30 detik	Mono	Aplikasi Ponsel	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Perempuan 1069 Laki-laki 262 Tidak diketahui 3	Kontak
Denmark_GC_8	Denmark	Denmark	da_DK	8 kHz	Percakapan Umum	372	Data Percakapan Umum Denmark	Percakapan telepon tanpa naskah antara dua orang. kira-kira Durasi Audio (Rentang) - 15-60 menit,	rangkap	Desktop	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Wanita: 311, Pria: 417, Tidak diketahui: 0	Kontak
Denmark_MA_16	Denmark	Denmark	da_DK	16 kHz	Audio Media	664	Data audio Media Denmark	File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit	Mono	Sumber Web	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Wanita: 369, Pria: 864, Tidak diketahui: 27	Kontak
Denmark_SM_48	Denmark	Denmark	da-DK	48 kHz	Monolog Bernaskah	2,579	Monolog Naskah Denmark	Rekaman ucapan tunggal, yang cenderung jatuh dalam rentang 5 hingga 30 detik, Denmark dari Denmark	Mono	Aplikasi Ponsel	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Perempuan 1551 Laki-laki 1233 Tidak diketahui 42	Kontak
Bahasa Inggris Deep South_CC_8	Inggris Jauh Selatan	Inggris Jauh Selatan	en_US	8 kHz	Pusat Panggilan	151	Data pusat panggilan Deep South Inggris	Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,	rangkap	Desktop	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Perempuan 221 , Laki-laki 1004 , Tidak diketahui 7	Kontak
Bahasa Inggris Deep South_GC_8	Inggris Jauh Selatan	Inggris Jauh Selatan	en_US	8 kHz	Percakapan Umum	56	Data Percakapan Umum Deep South Inggris	Percakapan telepon tanpa naskah antara dua orang. kira-kira Durasi Audio (Rentang) - 15-60 menit,	rangkap	Desktop	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Wanita 99, Pria 31, Tidak Diketahui 0	Kontak
Bahasa Inggris Deep South_MA_16	Inggris Jauh Selatan	Inggris Jauh Selatan	en_US	16 kHz	Audio Media	266	Data audio Deep South Media Inggris	File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit	Mono	Sumber Web	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Wanita 204, Pria 356, Tidak Diketahui 21	Kontak
Jerman_CC_8	Jerman	Jerman	de-De	8 kHz	Pusat Panggilan	64	Data pusat panggilan Jerman	Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,	Mono	Desktop		. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Perempuan 478 Laki-laki 1440 Tidak diketahui 0	Kontak
Jerman_IVR_8	Jerman	Jerman	de-De	8 kHz	IVR	200	Data IVR Jerman	Manusia ke Mesin. Jenis aliran IVR di mana ada prompt TTS (mis. "Bagaimana saya bisa membantu Anda") diikuti oleh respons spontan manusia	Mono	Desktop		. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Perempuan 10115 Laki-laki 8750 Tidak diketahui 0	Kontak
Gujarati_CC_8	gujarati	Gujarati (Dalam Pipa)	gu_IN		Pusat Panggilan	60	Data Pusat Panggilan Gujarati (In Pipeline).	Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,		Desktop	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa		Kontak
Gujarati_GC	gujarati	Gujarati (Dalam Pipa)	gu_IN		Percakapan Umum	100	Gujarati (In Pipeline) Data Percakapan Umum	Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,		Desktop	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa		Kontak
Gujarati_MA	gujarati	Gujarati (Dalam Pipa)	gu_IN		Audio Media	40	Gujarati (In Pipeline) Data audio media	File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit		Sumber Web	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa		Kontak
Ibrani_Percakapan Umum_8	Ibrani	Ibrani	dia_IL	8 kHz	Percakapan Umum	399	Data Percakapan Umum Bahasa Ibrani	Percakapan telepon tanpa naskah antara dua orang. kira-kira Durasi Audio (Rentang) - 15-60 menit, Ibrani di Israel	rangkap	Desktop	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Wanita 414 , Pria 399 , Tidak diketahui 1	Kontak
Ibrani_MA_16	Ibrani	Ibrani	dia_IL	16 kHz	Audio Media	427	Data audio Media Ibrani	File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit	Mono	Sumber Web	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Perempuan 361 , Laki-laki 513, Tidak Diketahui 13	Kontak
Hindi_MA_16	Hindi	Hindi	hai_IN	16 kHz	Audio Media	219	Data audio Media Hindi	File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit	Mono	Sumber Web	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Perempuan 83 , Laki-laki 309, Tidak Diketahui 0	Kontak
Hindi_SM_48	Hindi	Hindi	hi-IN	48 kHz	Monolog Bernaskah	2,867	Monolog Bernaskah Hindi	Rekaman ucapan tunggal, yang cenderung jatuh dalam rentang 5 hingga 30 detik	Mono	Aplikasi Ponsel	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Perempuan 1977 Laki-laki 1864 Tidak diketahui 147	Kontak
HINGLISH_CC_8	Bahasa inggris	Bahasa inggris	hg_IN	8 kHz	Pusat Panggilan	208	Data pusat panggilan	Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,	rangkap	Desktop	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Wanita 822, Pria 1262 , Tidak diketahui 0	Kontak
HINGLISH_MA_16	Bahasa inggris	Bahasa inggris	hg_IN	16 kHz	Audio Media	216	Data audio media	File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit	Mono	Sumber Web	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Wanita 75, Pria 380, Tidak Diketahui 0	Kontak
Hispanik_CC_8	Bahasa Inggris Hispanik	Bahasa Inggris Hispanik	en_US	8 kHz	Pusat Panggilan	212	Data pusat panggilan Hispanik	Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,	rangkap	Desktop	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Wanita 822, Pria 1262, Tidak Diketahui 0	Kontak
Hispanik_MA_16	Bahasa Inggris Hispanik	Bahasa Inggris Hispanik	en_US	16 kHz	Audio Media	155	Audio Media Panggilan Hispanik	File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit	Mono	Sumber Web	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Wanita 140, Pria 219, Tidak Diketahui 5	Kontak
Indonesia_GC_8	Indonesia	Indonesia	aku melakukannya	8 kHz	Percakapan Umum	496	Data Percakapan Umum Bahasa Indonesia	Percakapan telepon tanpa naskah antara dua orang. kira-kira Durasi Audio (Rentang) - 15-60 menit, Bahasa Indonesia	rangkap	Desktop	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Wanita 524, Pria 454, Tidak Diketahui 2	Kontak
Indonesia_MA_16	Indonesia	Indonesia	aku melakukannya	16 kHz	Audio Media	643	Data audio Media Indonesia	File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit	Mono	Sumber Web	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Wanita 746, Pria 1507, Tidak Diketahui 129	Kontak
Irlandia_GC_8	Irlandia	Irlandia	en_IE	8 kHz	Percakapan Umum	192	Data Percakapan Umum Irlandia	Percakapan telepon tanpa naskah antara dua orang. kira-kira Durasi Audio (Rentang) - 15-60 menit,	rangkap	Desktop	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Wanita 213 , Pria 153 , Tidak Diketahui 0	Kontak
Jepang_SM_48	Jepang	Jepang	ja-JP	48 kHz	Monolog Bernaskah	2,335	Monolog Naskah Jepang	Rekaman ucapan tunggal, yang cenderung jatuh dalam rentang 5 hingga 30 detik	Mono	Aplikasi Ponsel	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Perempuan 1460 Laki-laki 1221 Tidak diketahui 194	Kontak
Kannada_CC_8	kannada	Kannada (Dalam Pipa)	kn_IN		Pusat Panggilan	60	Data Pusat Panggilan Kannada (In Pipeline).	Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,		Desktop	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa		Kontak
Kannada_GC	kannada	Kannada (Dalam Pipa)	kn_IN		Percakapan Umum	100	Kannada (In Pipeline) Data Percakapan Umum	Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,		Desktop	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa		Kontak
Kannada_MA	kannada	Kannada (Dalam Pipa)	kn_IN		Audio Media	40	Kannada (In Pipeline) Data audio media	File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit		Sumber Web	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa		Kontak
Korea_CC_8	Korea	Korea	ko_kr	8 kHz	Pusat Panggilan	107	Data pusat panggilan Korea	Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,	rangkap	Desktop	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Perempuan 1086, Laki-laki 210 , Tidak diketahui 4	Kontak
korea_MA_16	Korea	Korea	ko_kr	16 kHz	Audio Media	204	Data audio media Korea	File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit	Mono	Sumber Web	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Perempuan 70 Laki-laki 303, Tidak diketahui 25	Kontak
Korea_SM_48	Korea	Korea	ko-KR	48 kHz	Monolog Bernaskah	1,955	Monolog Bernaskah Korea	Rekaman ucapan tunggal, yang cenderung jatuh dalam rentang 5 hingga 30 detik	Mono	Aplikasi Ponsel	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Perempuan 1195 Laki-laki 1134 Tidak diketahui 122	Kontak
Melayu_GC_8	Malay	Malay	ms_MY	8 kHz	Percakapan Umum	266	Data Percakapan Umum Bahasa Melayu	Percakapan telepon tanpa naskah antara dua orang. kira-kira Durasi Audio (Rentang) - 15-60 menit, Melayu di Malaysia	rangkap	Desktop	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Perempuan 316, Laki-laki 176 , Tidak diketahui 0	Kontak
Melayu_MA_16	Malay	Malay	ms_MY	16 kHz	Audio Media	344	Data audio Media Melayu	File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit	Mono	Sumber Web	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Wanita 236, Pria 626, Tidak Diketahui 47	Kontak
Malayalam_CC_8	Malayalam	Malayalam (Dalam Pipa)	ml_IN		Pusat Panggilan	60	Data Call-Center Malayalam (In Pipeline).	Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,		Desktop	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa		Kontak
Malayalam_GC	Malayalam	Malayalam (Dalam Pipa)	ml_IN		Percakapan Umum	100	Malayalam (In Pipeline) Data Percakapan Umum	Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,		Desktop	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa		Kontak
Malayalam_MA	Malayalam	Malayalam (Dalam Pipa)	ml_IN		Audio Media	40	Malayalam (In Pipeline) Data audio media	File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit		Sumber Web	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa		Kontak
Marathi_CC_8	Marathi	Marathi (Dalam Jalur Pipa)	Tuan_IN		Pusat Panggilan	60	Data Pusat Panggilan Marathi (In Pipeline).	Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,		Desktop	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa		Kontak
Marathi_GC	Marathi	Marathi (Dalam Jalur Pipa)	Tuan_IN		Percakapan Umum	100	Marathi (In Pipeline) Data Percakapan Umum	Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,		Desktop	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa		Kontak
Marathi_MA	Marathi	Marathi (Dalam Jalur Pipa)	Tuan_IN		Audio Media	40	Marathi (In Pipeline) Data audio media	File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit		Sumber Web	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa		Kontak
Meksiko_SM_48	Spanyol (Meksiko)	Spanyol (Meksiko)	es-MX	48 kHz	Monolog Bernaskah	1,492	Monolog Naskah Spanyol Meksiko	Rekaman ucapan tunggal, yang cenderung jatuh dalam rentang 5 hingga 30 detik	Mono	Aplikasi Ponsel	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Perempuan 1016 Laki-laki 1069 Tidak diketahui 95	Kontak
Belanda_SM_48	Dutch	Dutch	nl-NL	48 kHz	Monolog Bernaskah	1,205	Monolog Naskah Belanda	Rekaman ucapan tunggal, yang cenderung jatuh dalam rentang 5 hingga 30 detik	Mono	Aplikasi Ponsel	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Perempuan 1285 Laki-laki 531 Tidak diketahui 3	Kontak
Bahasa Inggris New York_CC_8	Bahasa Inggris New York	Bahasa Inggris New York	en_US	8 kHz	Pusat Panggilan	103	Data pusat panggilan Inggris New York	Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,	rangkap	Desktop	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Wanita 610, Pria 532, Tidak tahu 0	Kontak
New York Bahasa Inggris_GC_8	Bahasa Inggris New York	Bahasa Inggris New York	en_US	8 kHz	Percakapan Umum	107	Data Percakapan Umum Bahasa Inggris New York	Percakapan telepon tanpa naskah antara dua orang. kira-kira Durasi Audio (Rentang) - 15-60 menit,	rangkap	Desktop	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Wanita 118, Pria 114, Tidak Diketahui 0	Kontak
New York Bahasa Inggris_MA_16	Bahasa Inggris New York	Bahasa Inggris New York	en_US	16 kHz	Audio Media	140	Data audio Media Inggris New York	File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit	Mono	Sumber Web	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Wanita 66, Pria 230, Tidak Diketahui 11	Kontak
Selandia Baru_GC_8	Bahasa Inggris Selandia Baru	Bahasa Inggris Selandia Baru	en_NZ	8 kHz	Percakapan Umum	148	Data Percakapan Umum Bahasa Inggris Selandia Baru	Percakapan telepon tanpa naskah antara dua orang. kira-kira Durasi Audio (Rentang) - 15-60 menit,	rangkap	Desktop	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Perempuan 167, laki-laki 121, Tidak diketahui 4	Kontak
Selandia Baru_MA_16	Bahasa Inggris Selandia Baru	Bahasa Inggris Selandia Baru	en_NZ	16 kHz	Audio Media	400	Audio Media Bahasa Inggris Selandia Baru	File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit	Mono	Sumber Web	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Perempuan 367, laki-laki 678, Tidak diketahui 26	Kontak
Oriya_CC_8	Oriya	Oriya (Dalam Pipa)	atau_IN		Pusat Panggilan	60	Data Pusat Panggilan Oriya (In Pipeline).	Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,		Desktop	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa		Kontak
Oriya_GC	Oriya	Oriya (Dalam Pipa)	atau_IN		Percakapan Umum	100	Oriya (In Pipeline) Data Percakapan Umum	Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,		Desktop	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa		Kontak
Oriya_MA	Oriya	Oriya (Dalam Pipa)	atau_IN		Audio Media	40	Oriya (In Pipeline) Data audio media	File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit		Sumber Web	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa		Kontak
Polandia_MA_16	semir	semir	tolong_PL	16 kHz	Audio Media	269	Audio Media Polandia	File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit	Mono	Sumber Web	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Perempuan 173 Laki-laki 354 Tidak diketahui 6	Kontak
Polandia Poland_SM_48	Polandia (Polandia)	Polandia (Polandia)	pl-PL	48 kHz	Monolog Bernaskah	1,482	Polandia Polandia - Monolog Bernaskah	Rekaman ucapan tunggal, yang cenderung jatuh dalam rentang 5 hingga 30 detik	Mono	Aplikasi Ponsel	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Perempuan 1324 Laki-laki 701 Tidak diketahui 24	Kontak
Punjabi_CC_8	punjabi	Punjabi (Dalam Pipa)	punjabi		Pusat Panggilan	60	Data Pusat Panggilan Punjabi (In Pipeline).	Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,		Desktop	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa		Kontak
Punjabi_GC	punjabi	Punjabi (Dalam Pipa)	punjabi		Percakapan Umum	100	Punjabi (In Pipeline) Data Percakapan Umum	Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,		Desktop	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa		Kontak
Punjabi_MA	punjabi	Punjabi (Dalam Pipa)	punjabi		Audio Media	40	Punjabi (In Pipeline) Data audio media	File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit		Sumber Web	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa		Kontak
Rusia_SM_48	Rusia	Rusia	ru-RU	48 kHz	Monolog Bernaskah	2,398	Monolog Naskah Rusia	Rekaman ucapan tunggal, yang cenderung jatuh dalam rentang 5 hingga 30 detik	Mono	Aplikasi Ponsel	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Perempuan 1689 Laki-laki 1937 Tidak diketahui 214	Kontak
Skotlandia_GC_8	Skotlandia (aksen Inggris)	Skotlandia (aksen Inggris)	id_AB	8 kHz	Percakapan Umum	292	Data Percakapan Umum Skotlandia	Percakapan telepon tanpa naskah antara dua orang. kira-kira Durasi Audio (Rentang) - 15-60 menit,	rangkap	Desktop	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Perempuan 285 , Laki-laki 260, Tidak Diketahui 3	Kontak
Singapura_CC_8	Bahasa Inggris Singapura	Bahasa Inggris Singapura	en_SG	8 kHz	Pusat Panggilan	218	Data Pusat Panggilan Singapura	Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,	rangkap	Desktop	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Wanita 2139 , Pria 884, Tidak diketahui 21	Kontak
Singapura_MA_16	Bahasa Inggris Singapura	Bahasa Inggris Singapura	en_SG	16 kHz	Audio Media	247	Data audio Media Singapura	File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit	Mono	Sumber Web	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Wanita 160, Pria 455, Tidak Diketahui 37	Kontak
Inggris Afrika Selatan_CC_8	Bahasa Inggris Afrika Selatan	Bahasa Inggris Afrika Selatan	en_ZA	8 kHz	Pusat Panggilan	261	Data Pusat Panggilan Bahasa Inggris Afrika Selatan	Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,	rangkap	Desktop	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Wanita 1274 , Pria 935 , Tidak Diketahui 1	Kontak
Bahasa Inggris Afrika Selatan_MA_16	Bahasa Inggris Afrika Selatan	Bahasa Inggris Afrika Selatan	en_ZA	16 kHz	Audio Media	251	Data audio Media Inggris Afrika Selatan	File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit	Mono	Sumber Web	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Wanita 235, Pria 432, Tidak Diketahui 36	Kontak
Swahili_CC_8	swahili	swahili	sw_KE	8 kHz	Pusat Panggilan	230	Data Pusat Panggilan Swahili	Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,	rangkap	Desktop	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Wanita 611, Pria 833, Tidak Diketahui 0	Kontak
Swahili_MA_16	swahili	swahili	sw_KE	16 kHz	Audio Media	265	Data audio Media Swahili	File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit	Mono	Sumber Web	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Wanita 118, Pria 493, Tidak Diketahui 25	Kontak
Swedia_CC_8	Swedia	Swedia	sv_SE	8 kHz	Pusat Panggilan	250	Data Pusat Panggilan Swedia	Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,	rangkap	Desktop	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Perempuan 1581, laki-laki 727, Tidak Diketahui 2	Kontak
Swedia_MA_16	Swedia	Swedia	sv_SE	16 kHz	Audio Media	278	Data audio Media Swedia	File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit	Mono	Sumber Web	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Perempuan 195, laki-laki 500, Tidak Diketahui 21	Kontak
Tamil_CC_8	Tamil	Tamil (Dalam Pipa)	ta_IN		Pusat Panggilan	60	Data Pusat Panggilan Tamil (In Pipeline).	Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,		Desktop	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa		Kontak
Tamil_GC	Tamil	Tamil (Dalam Pipa)	ta_IN		Percakapan Umum	100	Data Percakapan Umum Tamil (In Pipeline).	Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,		Desktop	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa		Kontak
Tamil_MA	Tamil	Tamil (Dalam Pipa)	ta_IN		Audio Media	40	Tamil (In Pipeline) Data audio media	File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit		Sumber Web	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa		Kontak
Telugu_GC_8	telugu	telugu	te_IN	8 kHz	Percakapan Umum	553	Data Percakapan Umum Telugu	Percakapan telepon tanpa naskah antara dua orang. kira-kira Durasi Audio (Rentang) - 15-60 menit,	rangkap	Desktop	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Wanita 574 , Pria 564, Tidak diketahui 0	Kontak
Telugu_MA_16	telugu	telugu	te_IN	16 kHz	Audio Media	648	Data audio Media Telugu	File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit	Mono	Sumber Web	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Wanita 207, Pria 963, Tidak Diketahui 2	Kontak
Telugu_CC_8	telugu	Telugu (Dalam Pipa)	te_IN		Pusat Panggilan	30	Data Pusat Panggilan Telugu (In Pipeline).	Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,		Desktop	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa		Kontak
Telugu_GC	telugu	Telugu (Dalam Pipa)	te_IN		Percakapan Umum	50	Telugu (In Pipeline) Data Percakapan Umum	Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,		Desktop	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa		Kontak
Telugu_MA	telugu	Telugu (Dalam Pipa)	te_IN		Audio Media	20	Data audio media Telugu (In Pipeline).	File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit		Sumber Web	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa		Kontak
Thailand_GC_8	Thailand	Thailand	th_TH	8 kHz	Percakapan Umum	183	Percakapan Umum Thailand	Percakapan telepon tanpa naskah antara dua orang. kira-kira Durasi Audio (Rentang) - 15-60 menit, Sebuah register informal yang digunakan antara teman-teman	rangkap	Desktop	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Wanita 338, Pria 96, Tidak Diketahui 8	Kontak
Thailand_MA_8	Thailand	Thailand	th_TH	16 kHz	Audio Media	173	Audio Media Thailand	File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit	Mono	Sumber Web	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Wanita 143, Pria 502, Tidak Diketahui 26	Kontak
Turki Turki_SM_48	Turki Turki	Turki Turki	tr-TR	48 kHz	Monolog Bernaskah	2,027	Turki Turki	Rekaman ucapan tunggal, yang cenderung jatuh dalam rentang 5 hingga 30 detik	Mono	Aplikasi Ponsel	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Perempuan 1561 Laki-laki 1241 Tidak diketahui 31	Kontak
Vietnam_GC_8	Vietnam	Vietnam	vi_VN	8 kHz	Percakapan Umum	295	Data Percakapan Umum Vietnam	Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit, Utara (misalnya,Hanoi), Tengah, dan Selatan (misalnya, Kota Ho Chi Minh).	rangkap	Desktop	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Perempuan 400, laki-laki 380, Tidak diketahui 2	Kontak
Vietnam_MA_16	Vietnam	Vietnam	vi_VN	16 kHz	Audio Media	257	Data audio Media Vietnam	File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menit	Mono	Sumber Web	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Perempuan 249, laki-laki 200, Tidak diketahui 45	Kontak
Welsh_GC_8	Welsh (aksen Inggris)	Welsh (aksen Inggris)	en_WL	8 kHz	Percakapan Umum	278	Data Percakapan Umum Welsh	Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,	rangkap	Desktop	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Wanita 270, Pria 324, Tidak Diketahui 0	Kontak
Inggris Inggris_WW_16	Inggris Inggris	Inggris Inggris	en_uk	16 kHz	Bangun Word	200 Pembicara	Bangun Kata UK Inggris	pengumpulan data kata kunci 200 speaker 4 frasa kunci unik per speaker 25-30 rekaman frasa kunci berulang per frasa kunci unik 25-30 file audio per frasa unik 120 total ucapan yang direkam per pembicara	Channel 1	Aplikasi Ponsel	5.0	. Wav	.json	ASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa	Jenis Kelamin: 50% laki-laki, 50% perempuan, +/- 10%.	Kontak

Layanan yang ditawarkan

Pengumpulan data audio ahli tidak semuanya dilakukan untuk penyiapan AI yang komprehensif. Di Shaip, Anda bahkan dapat mempertimbangkan layanan berikut untuk membuat model jauh lebih luas dari biasanya:

Sumber Daya yang Direkomendasikan

Menawarkan

Anotasi Audio untuk AI Cerdas

Layanan anotasi audio telah menjadi keahlian Shaip sejak awal. Kembangkan, latih & tingkatkan AI percakapan, chatbot & mesin pengenalan suara dengan layanan anotasi audio canggih kami.

Panduan Pembeli

Panduan Pembeli: Panduan Lengkap untuk AI Percakapan

Chatbot yang Anda ajak bicara berjalan pada sistem AI percakapan canggih yang dilatih, diuji, dan dibuat menggunakan banyak kumpulan data pengenalan suara.

Katalog Data

Katalog & Lisensi Data Ucapan Siap Pakai

Ada berbagai macam aplikasi umum untuk data ucapan dalam proyek AI. Kami menawarkan sejumlah besar data berkualitas tinggi yang siap untuk pengenalan suara Anda.

Ingin membuat kumpulan data audio Anda sendiri?

Terhubung dengan pakar pengumpulan data ucapan internal kami untuk menyiapkan repositori audio yang paling sesuai dengan kebutuhan Anda

Nama Depan*
Nama Belakang*
Email*
Nomor Hp / Telephone*
Perusahaan*
Negara*
Negara
komentar*
Dengan mendaftar, saya setuju dengan Shaip Kebijakan Privasi dan Ketentuan Layanan dan memberikan persetujuan saya untuk menerima komunikasi pemasaran B2B dari Shaip.
CAPTCHA

Pertanyaan yang Sering Diajukan (FAQ)

1. Apa yang dimaksud dengan Pengumpulan Data Ucapan?

Pengumpulan Data Ucapan untuk Model ML mengacu pada proses pengumpulan rekaman audio bahasa lisan. Koleksi ini membantu dalam pelatihan dan menyempurnakan algoritme pembelajaran mesin, khususnya yang berpusat pada pemahaman dan pemrosesan suara manusia.

2. Bagaimana Cara Mengumpulkan Data Audio untuk ASR (Pengenalan Ucapan Otomatis)?

Saat ingin mengumpulkan data audio untuk Pengenalan Ucapan Otomatis (ASR), Anda harus mulai dengan menentukan kebutuhan spesifik proyek Anda, termasuk bahasa, aksen, dan jenis ucapan yang diinginkan. Setelah mengatur parameter ini, pastikan Anda mendapatkan semua izin yang diperlukan untuk menghormati privasi pengguna. Kemudian, gunakan alat perekam atau perangkat lunak yang sesuai untuk menangkap sampel audio yang jelas. Setiap rekaman harus diberi anotasi secara cermat beserta transkripsinya atau metadata terkait lainnya dan disimpan secara sistematis agar mudah diakses.

3. Penggunaan Kumpulan Data Ucapan untuk Pembelajaran Mesin

Kumpulan data ucapan dalam pembelajaran mesin sangat penting untuk pelatihan, pengujian, dan validasi model yang disesuaikan untuk mengenali, mentranskripsikan, atau menafsirkan bahasa lisan. Kumpulan data tersebut membuka jalan bagi berbagai aplikasi, mulai dari asisten suara dan layanan transkripsi hingga biometrik suara.

4. Bagaimana mengumpulkan data yang akurat dari berbagai bahasa dan aksen

Untuk mengumpulkan data yang tepat dari beragam bahasa dan aksen, kolaborasi dengan penutur asli dari latar belakang linguistik yang diinginkan sangatlah penting. Bertujuan untuk mendapatkan sampel yang bervariasi dan representatif untuk mencakup spektrum demografi yang luas. Gunakan peralatan perekaman standar di lingkungan yang seragam untuk memastikan konsistensi audio. Dan yang terpenting, beri anotasi pada setiap bagian data dengan transkripsi dan metadata terperinci, yang menunjukkan bahasa dan aksen tertentu.

Layanan Pengumpulan Data Pidato Paling Tepercaya untuk AI Anda

Temukan saluran data audio tanpa hambatan

Klien Unggulan

Layanan Pengumpulan Data Audio / Suara Profesional

Mata pelajaran apa saja. Skenario apa pun.

100 +

55K +

250 +

60 +

8 / 16 / 44 / 48 kHz

Keahlian kami

Sejajarkan Data Audio untuk Model NLP yang Lebih Cerdas

Koleksi Pidato Monolog

Pidato Dialog Koleksi

Grup / Muti-partai Percakapan

Koleksi Ucapan Bahasa Alami

Data Akustik Koleksi

Pengenalan Ucapan Otomatis (ASR)

Data Pelatihan Pidato/Audio Multibahasa

Text-to-Speech (TTS)

call Center Rekaman

Kisah Sukses

Alasan memilih Shaip sebagai Mitra Pengumpul Data Pidato Tepercaya Anda

Konsultan Ahli

Proses

Platform

Konsultan Ahli

Proses

Platform

Kumpulan Data Suara / Audio yang Tidak Tersedia

Layanan yang ditawarkan

Pengumpulan Data Teks Layanan

Layanan Pengumpulan Data Gambar

Layanan Pengumpulan Data Video

Sumber Daya yang Direkomendasikan

Menawarkan

Anotasi Audio untuk AI Cerdas

Panduan Pembeli

Panduan Pembeli: Panduan Lengkap untuk AI Percakapan

Katalog Data

Katalog & Lisensi Data Ucapan Siap Pakai

Ingin membuat kumpulan data audio Anda sendiri?

Pertanyaan yang Sering Diajukan (FAQ)

Layanan Data AI

Khusus

Industri

Produk

Perusahaan

Sumber

Hubungi Kami

Pidato Dialog
Koleksi

Grup / Muti-partai
Percakapan

Data Akustik
Koleksi

Text-to-Speech
(TTS)

call Center
Rekaman

Pengumpulan Data Teks
Layanan