Layanan Pengumpulan Data Pidato Paling Tepercaya untuk AI Anda

Latih model NLP, VA, prototipe TTS Anda, dan lainnya dengan data percakapan berkualitas, dengan layanan pengumpulan data audio dan ucapan kami

Pengumpulan data audio

Temukan saluran data audio tanpa hambatan

Klien Unggulan

Layanan Pengumpulan Data Audio / Suara Profesional

Mata pelajaran apa saja. Skenario apa pun.

Di Shaip, keahlian kami terletak pada pembuatan kumpulan data ucapan berkualitas tinggi yang dirancang untuk beragam kebutuhan AI/ML. Kami menawarkan beragam bahasa dan rekaman dalam beragam pengaturan sehingga menjadikan kumpulan data kami komprehensif dan mudah beradaptasi. HAIFokus kami adalah memberikan model dengan volume data ucapan khusus tertinggi, dalam waktu sesingkat mungkin. Bersama kami, Anda dapat mengharapkan: 

Koleksi pidato
  • Data audio/suara multibahasa berkualitas tinggi untuk meningkatkan akurasi
  • Tingkat kekhususan domain setinggi mungkin untuk tmenargetkan skenario yang beragam penyiapan
  •  Skalakan model ML Anda agar sesuai dengan demografi dan vertikal yang beragam
  • Lingkungan Perekaman: Kualitas Studio, menampilkan audio sejernih kristal dengan kebisingan latar belakang minimal, & Lingkungan Alam, di mana rekaman menggabungkan suara sekitar untuk meniru situasi dunia nyata.

100 +

Negara

55K +

Data Jam Pidato

250 +

Proyek

60 +

Bahasa (100+ Dialek)

8 / 16 / 44 / 48 kHz

Sampling rate

Keahlian kami

Sejajarkan Data Audio untuk Model NLP yang Lebih Cerdas

Shaip menawarkan layanan pengumpulan data ucapan/audio end-to-end dalam lebih dari 100 bahasa untuk memungkinkan teknologi yang diaktifkan suara untuk melayani beragam audiens di seluruh dunia. Kami dapat mengerjakan proyek dengan cakupan dan ukuran apa pun; mulai dari melisensikan kumpulan data audio siap pakai yang ada, hingga mengelola pengumpulan data audio khusus, hingga transkripsi dan anotasi audio. Tidak peduli seberapa besar proyek pengumpulan data ucapan Anda, kami dapat menyesuaikan layanan pengumpulan audio agar sesuai dengan kebutuhan Anda untuk membangun kumpulan data NLP berkualitas tinggi yang menargetkan dialek, nada, dan bahasa. Pilih dari berbagai kumpulan data ucapan dan sumber pengumpulan data audio kami, untuk penyiapan cerdas yang mengaktifkan suara.

Pidato monolog

Naskah Monolog & Pidato Spontan

Ini berfokus pada pemrosesan ucapan dari satu pembicara. Memanfaatkan perintah bernaskah untuk dimasukkan ke dalam file audio saluran tunggal, memastikan tertangkapnya pola bicara, nada, dan nuansa unik yang spesifik untuk individu tersebut.

Pidato dialog

Dialog Bernaskah & Pidato Spontan

Interaksi dua orang, mereplikasi percakapan dan dialog dunia nyata dengan paparan multibahasa melalui file saluran ganda dan sumber daya yang ditranskripsikan.

Percakapan multi-pihak

Grup / Muti-partai
Percakapan

Diskusi multi-orang, menangkap dinamika kelompok, tumpang tindih, dan nada yang bervariasi untuk melatih model ucapan secara akurat.

Kumpulan ujaran kata bangun

Kumpulan Kata Bangun / Frasa Kunci / Ucapan

Latih AI untuk mengidentifikasi frasa kunci atau kata-kata atau ucapan yang memiliki makna serupa menggunakan ucapan yang beragam, kaya, dan autentik untuk pemrosesan dan pemahaman bahasa alami tingkat lanjut.

Pidato akustik

Data Akustik
Koleksi

Kami dapat merekam data audio berkualitas studio secara profesional baik itu restoran, kantor, atau rumah atau dari berbagai lingkungan dan bahasa, sekaligus mencakup jangkauan akustik yang lebih luas (Comprehensive Sound Datasets).

Pengenalan ucapan otomatis

Pengenalan Ucapan Otomatis (ASR)

Tingkatkan akurasi sistem pengenalan ucapan otomatis (ASR) Anda dengan memiliki akses ke kumpulan data ucapan/audio yang terdiversifikasi, dari beragam demografi.

Ucapan bahasa alami

Data Pelatihan Pidato/Audio Multibahasa

Profesional bahasa kami yang ahli di seluruh dunia menawarkan data audio/ucapan multibahasa dalam berbagai bahasa dan dialek. Upaya ini mendorong komunikasi global dan menjembatani hambatan bahasa, sehingga berkontribusi terhadap solusi AI yang lebih inklusif dan efektif.

Asisten virtual digital

Text-to-Speech
(TTS)

Bangun model multibahasa text-to-speech (TTS) dengan bantuan tenaga kerja global kami, yang membantu Anda mengumpulkan data ucapan dalam 150+ bahasa & dialek untuk menyempurnakan model AI Anda mulai dari kontrol dalam mobil hingga chatbots dan solusi pembelajaran dengan kemampuan tinggi data audio berkualitas.

Rekaman pusat panggilan

call Center
Percakapan

Pertukaran asli antara agen dan klien, mendukung berbagai bahasa seperti Spanyol, Jerman, Inggris Amerika, Bengali, Jepang, Cina, dan Hindi.

Kisah Sukses

Kumpulan data AI percakapan dengan lebih dari 3 ribu jam data dalam 8 bahasa

Ingin membangun platform multibahasa untuk bahasa India, klien bermitra dengan Shaip untuk mengumpulkan, mengelompokkan, dan menyalin kumpulan data besar dalam berbagai bahasa India. Hal ini akan membantu mengembangkan model ucapan efektif yang dapat mendukung platform baru klien yang inovatif.

Masalah: Lebih dari 3,000 jam data audio dikumpulkan dalam 8 bahasa India, disegmentasi dan ditranskripsi untuk mengembangkan pengenalan ucapan otomatis.

Larutan: Kami menyediakan pengumpulan data, segmentasi, transkripsi, dan mengirimkan file JSON dengan metadata. Kami mengumpulkan 3000 jam data audio dalam 8 bahasa India dalam skala besar untuk proyek teknologi ucapan klien.

Studi kasus pengumpulan data pidato

Alasan memilih Shaip sebagai Mitra Pengumpul Data Pidato Tepercaya Anda

Konsultan Ahli

Konsultan Ahli

Tim yang berdedikasi dan terlatih:

  • 30,000+ kolaborator untuk Pembuatan Data, Pelabelan & QA
  • Tim Manajemen Proyek Terpercaya
  • Tim Pengembangan Produk Berpengalaman
  • Tim Sumber & Orientasi Pangkalan Bakat
Proses

Proses

Efisiensi proses tertinggi dijamin dengan:

  • Proses Gerbang Panggung 6 Sigma yang Kuat
  • Tim khusus yang terdiri dari sabuk hitam 6 Sigma – Pemilik proses utama & Kepatuhan kualitas
  • Perbaikan Berkelanjutan & Putaran Umpan Balik
Platform

Platform

Platform yang dipatenkan menawarkan manfaat:

  • Platform ujung ke ujung berbasis web
  • Kualitas Sempurna
  • TAT lebih cepat
  • Pengiriman Mulus

Kumpulan Data Suara / Audio yang Tidak Tersedia

RincianKumpulan Data BahasaTingkat SampelJenis Set DataTotal Jam AudioDeskripsi SingkatDeskripsi kumpulan dataAudio SaluranPlatform PerekamanAPA (%)Audio FormatFormat TranskripsiUse CaseJumlah PembicaraCTA
PidatoNew York Bahasa Inggris_GC_8Bahasa Inggris New YorkBahasa Inggris New Yorken_US8 kHzPercakapan Umum107Data Percakapan Umum Bahasa Inggris New YorkPercakapan telepon tanpa naskah antara dua orang. kira-kira Durasi Audio (Rentang) - 15-60 menit, rangkapDesktop5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaWanita 118, Pria 114, Tidak Diketahui 0
PidatoRusia_SM_48RusiaRusiaru-RU48 kHzMonolog Bernaskah2,398Monolog Naskah RusiaRekaman ucapan tunggal, yang cenderung jatuh dalam rentang 5 hingga 30 detikMonoAplikasi Ponsel5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaPerempuan 1689 Laki-laki 1937 Tidak diketahui 214
PidatoPunjabi_MApunjabiPunjabi (Dalam Pipa) punjabi Audio Media40Punjabi (In Pipeline) Data audio mediaFile audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menitSumber Web5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa
PidatoPunjabi_GCpunjabiPunjabi (Dalam Pipa) punjabiPercakapan Umum100Punjabi (In Pipeline) Data Percakapan UmumPercakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,Desktop5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa
PidatoPunjabi_CC_8punjabiPunjabi (Dalam Pipa) punjabiPusat Panggilan60Data Pusat Panggilan Punjabi (In Pipeline).Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,Desktop5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa
PidatoPolandia Poland_SM_48Polandia (Polandia)Polandia (Polandia)pl-PL48 kHzMonolog Bernaskah1,482Polandia Polandia - Monolog BernaskahRekaman ucapan tunggal, yang cenderung jatuh dalam rentang 5 hingga 30 detikMonoAplikasi Ponsel5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaPerempuan 1324 Laki-laki 701 Tidak diketahui 24
PidatoPolandia_MA_16semirsemirtolong_PL16 kHzAudio Media269Audio Media PolandiaFile audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menitMonoSumber Web5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaPerempuan 173 Laki-laki 354 Tidak diketahui 6
PidatoOriya_MAOriyaOriya (Dalam Pipa) atau_INAudio Media40Oriya (In Pipeline) Data audio mediaFile audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menitSumber Web5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa
PidatoOriya_GCOriyaOriya (Dalam Pipa) atau_INPercakapan Umum100Oriya (In Pipeline) Data Percakapan UmumPercakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,Desktop5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa
PidatoOriya_CC_8OriyaOriya (Dalam Pipa) atau_INPusat Panggilan60Data Pusat Panggilan Oriya (In Pipeline).Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,Desktop5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa
PidatoSelandia Baru_MA_16Bahasa Inggris Selandia Baru Bahasa Inggris Selandia Baru en_NZ16 kHzAudio Media400Audio Media Bahasa Inggris Selandia BaruFile audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menitMonoSumber Web5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaPerempuan 367, laki-laki 678, Tidak diketahui 26
PidatoSelandia Baru_GC_8Bahasa Inggris Selandia Baru Bahasa Inggris Selandia Baru en_NZ8 kHzPercakapan Umum148Data Percakapan Umum Bahasa Inggris Selandia BaruPercakapan telepon tanpa naskah antara dua orang. kira-kira Durasi Audio (Rentang) - 15-60 menit, rangkapDesktop5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaPerempuan 167, laki-laki 121, Tidak diketahui 4
PidatoNew York Bahasa Inggris_MA_16Bahasa Inggris New YorkBahasa Inggris New Yorken_US16 kHzAudio Media140Data audio Media Inggris New YorkFile audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menitMonoSumber Web5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaWanita 66, Pria 230, Tidak Diketahui 11
PidatoSkotlandia_GC_8Skotlandia (aksen Inggris)Skotlandia (aksen Inggris)id_AB8 kHzPercakapan Umum292Data Percakapan Umum SkotlandiaPercakapan telepon tanpa naskah antara dua orang. kira-kira Durasi Audio (Rentang) - 15-60 menit, rangkapDesktop5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaPerempuan 285 , Laki-laki 260, Tidak Diketahui 3
PidatoBahasa Inggris New York_CC_8Bahasa Inggris New YorkBahasa Inggris New Yorken_US8 kHzPusat Panggilan103Data pusat panggilan Inggris New YorkPercakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,rangkapDesktop5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaWanita 610, Pria 532, Tidak tahu 0
PidatoBelanda_SM_48DutchDutchnl-NL48 kHzMonolog Bernaskah1,205Monolog Naskah BelandaRekaman ucapan tunggal, yang cenderung jatuh dalam rentang 5 hingga 30 detikMonoAplikasi Ponsel5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaPerempuan 1285 Laki-laki 531 Tidak diketahui 3
PidatoMeksiko_SM_48Spanyol (Meksiko)Spanyol (Meksiko)es-MX48 kHzMonolog Bernaskah1,492Monolog Naskah Spanyol MeksikoRekaman ucapan tunggal, yang cenderung jatuh dalam rentang 5 hingga 30 detikMonoAplikasi Ponsel5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaPerempuan 1016 Laki-laki 1069 Tidak diketahui 95
PidatoMarathi_MAMarathiMarathi (Dalam Jalur Pipa) Tuan_INAudio Media40Marathi (In Pipeline) Data audio mediaFile audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menitSumber Web5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa
PidatoMarathi_GCMarathiMarathi (Dalam Jalur Pipa) Tuan_INPercakapan Umum100Marathi (In Pipeline) Data Percakapan UmumPercakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,Desktop5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa
PidatoMarathi_CC_8MarathiMarathi (Dalam Jalur Pipa) Tuan_INPusat Panggilan60Data Pusat Panggilan Marathi (In Pipeline).Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,Desktop5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa
PidatoMalayalam_MAMalayalamMalayalam (Dalam Pipa) ml_INAudio Media40Malayalam (In Pipeline) Data audio mediaFile audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menitSumber Web5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa
PidatoMalayalam_GCMalayalamMalayalam (Dalam Pipa) ml_INPercakapan Umum100Malayalam (In Pipeline) Data Percakapan UmumPercakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,Desktop5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa
PidatoMalayalam_CC_8MalayalamMalayalam (Dalam Pipa) ml_INPusat Panggilan60Data Call-Center Malayalam (In Pipeline).Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,Desktop5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa
PidatoMelayu_MA_16MalayMalayms_MY16 kHzAudio Media344Data audio Media MelayuFile audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menitMonoSumber Web5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaWanita 236, Pria 626, Tidak Diketahui 47
PidatoMelayu_GC_8MalayMalayms_MY8 kHzPercakapan Umum266Data Percakapan Umum Bahasa MelayuPercakapan telepon tanpa naskah antara dua orang. kira-kira Durasi Audio (Rentang) - 15-60 menit, Melayu di MalaysiarangkapDesktop5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaPerempuan 316, Laki-laki 176 , Tidak diketahui 0
PidatoTelugu_GC_8telugutelugute_IN8 kHzPercakapan Umum553Data Percakapan Umum TeluguPercakapan telepon tanpa naskah antara dua orang. kira-kira Durasi Audio (Rentang) - 15-60 menit, rangkapDesktop5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaWanita 574 , Pria 564, Tidak diketahui 0
PidatoInggris Inggris_WW_16Inggris InggrisInggris Inggrisen_uk16 kHzBangun Word200 PembicaraBangun Kata UK Inggrispengumpulan data kata kunci
  • 200 speaker
  • 4 frasa kunci unik per speaker
  • 25-30 rekaman frasa kunci berulang per frasa kunci unik
  • 25-30 file audio per frasa unik
  • 120 total ucapan yang direkam per pembicara
Channel 1Aplikasi Ponsel5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaJenis Kelamin: 50% laki-laki, 50% perempuan, +/- 10%.
PidatoWelsh_GC_8Welsh (aksen Inggris)Welsh (aksen Inggris)en_WL8 kHzPercakapan Umum278Data Percakapan Umum WelshPercakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,rangkapDesktop5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaWanita 270, Pria 324, Tidak Diketahui 0
PidatoVietnam_MA_16VietnamVietnamvi_VN16 kHzAudio Media257Data audio Media VietnamFile audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menitMonoSumber Web5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaPerempuan 249, laki-laki 200, Tidak diketahui 45
PidatoVietnam_GC_8VietnamVietnamvi_VN8 kHzPercakapan Umum295Data Percakapan Umum VietnamPercakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit, Utara (misalnya,Hanoi), Tengah, dan Selatan (misalnya, Kota Ho Chi Minh).rangkapDesktop5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaPerempuan 400, laki-laki 380, Tidak diketahui 2
PidatoTurki Turki_SM_48Turki TurkiTurki Turkitr-TR48 kHzMonolog Bernaskah2,027Turki TurkiRekaman ucapan tunggal, yang cenderung jatuh dalam rentang 5 hingga 30 detikMonoAplikasi Ponsel5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaPerempuan 1561 Laki-laki 1241 Tidak diketahui 31
PidatoThailand_MA_8ThailandThailandth_TH16 kHzAudio Media173Audio Media ThailandFile audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menitMonoSumber Web5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaWanita 143, Pria 502, Tidak Diketahui 26
PidatoThailand_GC_8ThailandThailandth_TH8 kHzPercakapan Umum183Percakapan Umum ThailandPercakapan telepon tanpa naskah antara dua orang. kira-kira Durasi Audio (Rentang) - 15-60 menit, Sebuah register informal yang digunakan antara teman-temanrangkapDesktop5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaWanita 338, Pria 96, Tidak Diketahui 8
PidatoTelugu_MAteluguTelugu (Dalam Pipa) te_INAudio Media20Data audio media Telugu (In Pipeline).File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menitSumber Web5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa
PidatoTelugu_GCteluguTelugu (Dalam Pipa) te_INPercakapan Umum50Telugu (In Pipeline) Data Percakapan UmumPercakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,Desktop5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa
PidatoTelugu_CC_8teluguTelugu (Dalam Pipa) te_INPusat Panggilan30Data Pusat Panggilan Telugu (In Pipeline).Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,Desktop5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa
PidatoTelugu_MA_16telugutelugute_IN16 kHzAudio Media648Data audio Media TeluguFile audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menitMonoSumber Web5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaWanita 207, Pria 963, Tidak Diketahui 2
PidatoKorea_SM_48KoreaKoreako-KR48 kHzMonolog Bernaskah1,955Monolog Bernaskah KoreaRekaman ucapan tunggal, yang cenderung jatuh dalam rentang 5 hingga 30 detikMonoAplikasi Ponsel5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaPerempuan 1195 Laki-laki 1134 Tidak diketahui 122
PidatoTamil_MATamil Tamil (Dalam Pipa) ta_INAudio Media40Tamil (In Pipeline) Data audio mediaFile audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menitSumber Web5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa
PidatoTamil_GCTamilTamil (Dalam Pipa) ta_INPercakapan Umum100Data Percakapan Umum Tamil (In Pipeline).Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,Desktop5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa
PidatoTamil_CC_8TamilTamil (Dalam Pipa) ta_INPusat Panggilan60Data Pusat Panggilan Tamil (In Pipeline).Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,Desktop5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa
PidatoSwedia_MA_16SwediaSwediasv_SE16 kHzAudio Media278Data audio Media SwediaFile audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menitMonoSumber Web5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaPerempuan 195, laki-laki 500, Tidak Diketahui 21
PidatoSwedia_CC_8SwediaSwediasv_SE8 kHzPusat Panggilan250Data Pusat Panggilan SwediaPercakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,rangkapDesktop5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaPerempuan 1581, laki-laki 727, Tidak Diketahui 2
PidatoSwahili_MA_16swahiliswahilisw_KE16 kHzAudio Media265Data audio Media SwahiliFile audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menitMonoSumber Web5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaWanita 118, Pria 493, Tidak Diketahui 25
PidatoSwahili_CC_8swahiliswahilisw_KE8 kHzPusat Panggilan230Data Pusat Panggilan SwahiliPercakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,rangkapDesktop5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaWanita 611, Pria 833, Tidak Diketahui 0
PidatoBahasa Inggris Afrika Selatan_MA_16Bahasa Inggris Afrika SelatanBahasa Inggris Afrika Selatanen_ZA16 kHzAudio Media251Data audio Media Inggris Afrika SelatanFile audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menitMonoSumber Web5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaWanita 235, Pria 432, Tidak Diketahui 36
PidatoInggris Afrika Selatan_CC_8Bahasa Inggris Afrika SelatanBahasa Inggris Afrika Selatanen_ZA8 kHzPusat Panggilan261Data Pusat Panggilan Bahasa Inggris Afrika SelatanPercakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,rangkapDesktop5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaWanita 1274 , Pria 935 , Tidak Diketahui 1
PidatoSingapura_MA_16Bahasa Inggris SingapuraBahasa Inggris Singapuraen_SG16 kHzAudio Media247Data audio Media SingapuraFile audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menitMonoSumber Web5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaWanita 160, Pria 455, Tidak Diketahui 37
PidatoSingapura_CC_8Bahasa Inggris SingapuraBahasa Inggris Singapuraen_SG8 kHzPusat Panggilan218Data Pusat Panggilan SingapuraPercakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,rangkapDesktop5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaWanita 2139 , Pria 884, Tidak diketahui 21
PidatoBoston_CC_8Bahasa Inggris BostonBahasa Inggris Bostonen_US8 kHzPusat Panggilan177Data pusat panggilan BostonPercakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,rangkapDesktop5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaWanita: 605, Pria: 711, dan Tidak Diketahui: 0
PidatoBahasa Inggris Deep South_CC_8Inggris Jauh SelatanInggris Jauh Selatanen_US8 kHzPusat Panggilan151Data pusat panggilan Deep South InggrisPercakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,rangkapDesktop5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaPerempuan 221 , Laki-laki 1004 , Tidak diketahui 7
PidatoDenmark_SM_48DenmarkDenmarkda-DK48 kHzMonolog Bernaskah2,579Monolog Naskah DenmarkRekaman ucapan tunggal, yang cenderung jatuh dalam rentang 5 hingga 30 detik, Denmark dari DenmarkMonoAplikasi Ponsel5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaPerempuan 1551 Laki-laki 1233 Tidak diketahui 42
PidatoDenmark_MA_16DenmarkDenmarkda_DK16 kHzAudio Media664Data audio Media DenmarkFile audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menitMonoSumber Web5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaWanita: 369, Pria: 864, Tidak diketahui: 27
PidatoDenmark_GC_8DenmarkDenmarkda_DK8 kHzPercakapan Umum372Data Percakapan Umum DenmarkPercakapan telepon tanpa naskah antara dua orang. kira-kira Durasi Audio (Rentang) - 15-60 menit, rangkapDesktop5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaWanita: 311, Pria: 417, Tidak diketahui: 0
PidatoTradisional Cina_SM_48Cina TradisionalCina Tradisionalzh-TW48 kHzMonolog Bernaskah1,028Cina TradisionalRekaman ucapan tunggal, yang cenderung jatuh dalam rentang 5 hingga 30 detikMonoAplikasi Ponsel5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaPerempuan 1069 Laki-laki 262 Tidak diketahui 3
PidatoCina Sederhana_SM_48Cina SederhanaCina Sederhanazh-CN48 kHzMonolog Bernaskah2,762Cina SederhanaRekaman ucapan tunggal, yang cenderung jatuh dalam rentang 5 hingga 30 detikMonoAplikasi Ponsel5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaPerempuan 1920 Laki-laki 1535 Tidak diketahui 270
PidatoCina_MA_16Bahasa Inggris MandarinBahasa Inggris Mandarinen_US16 kHzAudio Media249Data audio Media CinaFile audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menitMonoSumber Web5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaWanita: 126, Pria: 346 dan Tidak Diketahui: 6
PidatoCina_CC_8Bahasa Inggris MandarinBahasa Inggris Mandarinen_US8 kHzPusat Panggilan169Data pusat panggilan CinaPercakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,rangkapDesktop5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaWanita: 1790, Pria: 523 dan Tidak Diketahui: 13
PidatoKanada_SM_48Perancis KanadaPerancis Kanadafr-CA48 kHzMonolog Bernaskah1,222Perancis KanadaRekaman ucapan tunggal, yang cenderung jatuh dalam rentang 5 hingga 30 detikMonoAplikasi Ponsel5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaPerempuan 974 Laki-laki 631 Tidak diketahui 1
PidatoBoston_MA_16Bahasa Inggris BostonBahasa Inggris Bostonen_US16 kHzAudio Media93Data audio Boston MediaFile audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menitMonoSumber Web5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaWanita: 43, Pria: 181, dan Tidak Diketahui: 2
PidatoBoston_GC_8Bahasa Inggris BostonBahasa Inggris Bostonen_US8 kHzPercakapan Umum32Data Percakapan Umum BostonPercakapan telepon tanpa naskah antara dua orang. kira-kira Durasi Audio (Rentang) - 15-60 menit, rangkapDesktop5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaWanita: 53, Pria: 83, dan Tidak Diketahui: 0
PidatoBahasa Inggris Deep South_GC_8Inggris Jauh SelatanInggris Jauh Selatanen_US8 kHzPercakapan Umum56Data Percakapan Umum Deep South InggrisPercakapan telepon tanpa naskah antara dua orang. kira-kira Durasi Audio (Rentang) - 15-60 menit, rangkapDesktop5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaWanita 99, Pria 31, Tidak Diketahui 0
PidatoBengali_MABenggalaBengali (Dalam Pipa) bn_INAudio Media40Bengali (In Pipeline) Data audio mediaFile audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menitSumber Web5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa
PidatoBengali_GCBenggalaBengali (Dalam Pipa) bn_INPercakapan Umum100Data Percakapan Umum Bengali (In Pipeline).Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,Desktop5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa
PidatoBengali_CC_8BenggalaBengali (Dalam Pipa) bn_INPusat Panggilan60Data Pusat Panggilan Bengali (In Pipeline).Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,Desktop5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa
PidatoAssam_MAAssameseAssam (Dalam Pipa) seperti dalamAudio Media40Data audio media Assam (In Pipeline).File audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menitSumber Web5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa
PidatoAssam_GCAssameseAssam (Dalam Pipa) seperti dalamPercakapan Umum100Data Percakapan Umum Assam (In Pipeline).Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,Desktop5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa
PidatoAssam_CC_8AssameseAssam (Dalam Pipa) seperti dalamPusat Panggilan60Data Pusat Panggilan Assam (In Pipeline).Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,Desktop5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa
PidatoArab_SM_48ArabArabar-SA48 kHzMonolog Bernaskah1,947Monolog Bertulisan ArabRekaman ucapan tunggal, yang cenderung jatuh dalam rentang 5 hingga 30 detikMonoAplikasi Ponsel5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaPerempuan 838 Laki-laki 1209 Tidak diketahui 78
PidatoArab_GC_8ArabArabar_AE8 kHzPercakapan Umum292Data Percakapan Umum Bahasa ArabPercakapan telepon tanpa naskah antara dua orang. kira-kira Durasi Audio (Rentang) - 15-60 menit, Arab dari negara-negara TelukrangkapDesktop5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaWanita: 171, Pria: 534, dan Tidak Diketahui: 1
PidatoAfrikaans_MA_16AfrikanasAfrikanasaf_ZA16 kHzAudio Media658File Media AfrikaansFile audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menitMonoSumber Web5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaWanita: 750, Pria: 1278, dan Tidak Diketahui: 52
PidatoAfrikaans_GC_8AfrikanasAfrikanasaf_ZA8 kHzPercakapan Umum368Data Percakapan Umum AfrikaPercakapan telepon tanpa naskah antara dua orang. kira-kira Durasi Audio (Rentang) - 15-60 menit, Bahasa Afrikaans diucapkan di AfrikarangkapDesktop5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaWanita: 502, Pria: 390, dan Tidak Diketahui: 2
Pidatoid_US_MA_16Bahasa Afrika Amerika AmericanBahasa Afrika Amerika Americanen_US16 kHzAudio Media154Data Media Vernakular Afrika-AmerikaFile audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menitMonoSumber Web5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaWanita: 151, Pria: 150, dan Tidak Diketahui: 10
PidatoHINGLISH_MA_16Bahasa inggrisBahasa inggrishg_IN16 kHzAudio Media216Data audio mediaFile audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menitMonoSumber Web5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaWanita 75, Pria 380, Tidak Diketahui 0
Pidatokorea_MA_16KoreaKoreako_kr16 kHzAudio Media204Data audio media KoreaFile audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menitMonoSumber Web5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaPerempuan 70 Laki-laki 303, Tidak diketahui 25
PidatoKorea_CC_8KoreaKoreako_kr8 kHzPusat Panggilan107Data pusat panggilan KoreaPercakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,rangkapDesktop5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaPerempuan 1086, Laki-laki 210 , Tidak diketahui 4
PidatoKannada_MAkannadaKannada (Dalam Pipa) kn_INAudio Media40Kannada (In Pipeline) Data audio mediaFile audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menitSumber Web5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa
PidatoKannada_GCkannadaKannada (Dalam Pipa) kn_INPercakapan Umum100Kannada (In Pipeline) Data Percakapan UmumPercakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,Desktop5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa
PidatoKannada_CC_8kannadaKannada (Dalam Pipa) kn_INPusat Panggilan60Data Pusat Panggilan Kannada (In Pipeline).Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,Desktop5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa
PidatoJepang_SM_48JepangJepangja-JP48 kHzMonolog Bernaskah2,335Monolog Naskah JepangRekaman ucapan tunggal, yang cenderung jatuh dalam rentang 5 hingga 30 detikMonoAplikasi Ponsel5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaPerempuan 1460 Laki-laki 1221 Tidak diketahui 194
PidatoIrlandia_GC_8IrlandiaIrlandiaen_IE8 kHzPercakapan Umum192Data Percakapan Umum IrlandiaPercakapan telepon tanpa naskah antara dua orang. kira-kira Durasi Audio (Rentang) - 15-60 menit, rangkapDesktop5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaWanita 213 , Pria 153 , Tidak Diketahui 0
PidatoIndonesia_MA_16IndonesiaIndonesiaaku melakukannya16 kHzAudio Media643Data audio Media IndonesiaFile audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menitMonoSumber Web5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaWanita 746, Pria 1507, Tidak Diketahui 129
PidatoIndonesia_GC_8IndonesiaIndonesiaaku melakukannya8 kHzPercakapan Umum496Data Percakapan Umum Bahasa IndonesiaPercakapan telepon tanpa naskah antara dua orang. kira-kira Durasi Audio (Rentang) - 15-60 menit, Bahasa IndonesiarangkapDesktop5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaWanita 524, Pria 454, Tidak Diketahui 2
PidatoHispanik_MA_16Bahasa Inggris HispanikBahasa Inggris Hispaniken_US16 kHzAudio Media155Audio Media Panggilan HispanikFile audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menitMonoSumber Web5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaWanita 140, Pria 219, Tidak Diketahui 5
PidatoHispanik_CC_8Bahasa Inggris HispanikBahasa Inggris Hispaniken_US8 kHzPusat Panggilan212Data pusat panggilan HispanikPercakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,rangkapDesktop5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaWanita 822, Pria 1262, Tidak Diketahui 0
Pidatoid_US_CC_8Bahasa Afrika Amerika AmericanBahasa Afrika Amerika Americanen_US8 kHzPusat panggilan211Data pusat panggilan Vernakular Afrika-AmerikaPercakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,rangkapDesktop5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaWanita: 612, Pria: 1242, dan Tidak Diketahui: 12
PidatoHINGLISH_CC_8Bahasa inggrisBahasa inggrishg_IN8 kHzPusat Panggilan208Data pusat panggilanPercakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,rangkapDesktop5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaWanita 822, Pria 1262 , Tidak diketahui 0
PidatoHindi_SM_48HindiHindihi-IN48 kHzMonolog Bernaskah2,867Monolog Bernaskah HindiRekaman ucapan tunggal, yang cenderung jatuh dalam rentang 5 hingga 30 detikMonoAplikasi Ponsel5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaPerempuan 1977 Laki-laki 1864 Tidak diketahui 147
PidatoHindi_MA_16HindiHindihai_IN16 kHzAudio Media219Data audio Media HindiFile audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menitMonoSumber Web5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaPerempuan 83 , Laki-laki 309, Tidak Diketahui 0
PidatoIbrani_MA_16IbraniIbranidia_IL16 kHzAudio Media427Data audio Media IbraniFile audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menitMonoSumber Web5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaPerempuan 361 , Laki-laki 513, Tidak Diketahui 13
PidatoIbrani_Percakapan Umum_8IbraniIbranidia_IL8 kHzPercakapan Umum399Data Percakapan Umum Bahasa IbraniPercakapan telepon tanpa naskah antara dua orang. kira-kira Durasi Audio (Rentang) - 15-60 menit, Ibrani di IsraelrangkapDesktop5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaWanita 414 , Pria 399 , Tidak diketahui 1
PidatoGujarati_MAgujaratiGujarati (Dalam Pipa) gu_INAudio Media40Gujarati (In Pipeline) Data audio mediaFile audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menitSumber Web5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa
PidatoGujarati_GCgujaratiGujarati (Dalam Pipa) gu_INPercakapan Umum100Gujarati (In Pipeline) Data Percakapan UmumPercakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,Desktop5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa
PidatoGujarati_CC_8gujaratiGujarati (Dalam Pipa) gu_INPusat Panggilan60Data Pusat Panggilan Gujarati (In Pipeline).Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,Desktop5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa
PidatoJerman_IVR_8JermanJermande-De8 kHz IVR200Data IVR JermanManusia ke Mesin. Jenis aliran IVR di mana ada prompt TTS (mis. "Bagaimana saya bisa membantu Anda") diikuti oleh respons spontan manusiaMonoDesktop. Wav .jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan Bahasa Perempuan 10115 Laki-laki 8750 Tidak diketahui 0
PidatoJerman_CC_8JermanJermande-De8 kHzPusat Panggilan64Data pusat panggilan Jerman Percakapan telepon sintetis tanpa naskah antara "agen" dan "pelanggan", Kira-kira. Durasi Audio (Rentang) 5-15 Menit,MonoDesktop. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaPerempuan 478 Laki-laki 1440 Tidak diketahui 0
PidatoBahasa Inggris Deep South_MA_16Inggris Jauh SelatanInggris Jauh Selatanen_US16 kHzAudio Media266Data audio Deep South Media InggrisFile audio/video domain publik yang dapat dilisensikan seperti wawancara, podcast, dll - 1 hingga 5 orang. kira-kira Durasi Audio (Rentang) 15-60 menitMonoSumber Web5.0. Wav.jsonASR, Asisten Virtual, Chatbot, AI Percakapan, Analisis Ucapan, TTS, Pemodelan BahasaWanita 204, Pria 356, Tidak Diketahui 21

Layanan yang ditawarkan

Pengumpulan data audio ahli tidak semuanya dilakukan untuk penyiapan AI yang komprehensif. Di Shaip, Anda bahkan dapat mempertimbangkan layanan berikut untuk membuat model jauh lebih luas dari biasanya:

Pengumpulan data teks

Pengumpulan Data Teks
Layanan

Nilai sebenarnya dari layanan pengumpulan data kognitif Shaip adalah memberikan organisasi kunci untuk membuka informasi penting yang ditemukan dalam data tidak terstruktur

Pengumpulan data gambar

Layanan Pengumpulan Data Gambar

Pastikan model visi komputer Anda mengidentifikasi setiap gambar secara akurat, untuk melatih model AI generasi mendatang dengan lancar

Pengumpulan data video

Layanan Pengumpulan Data Video

Sekarang fokus pada visi komputer bersama dengan NLP untuk melatih model Anda untuk mengidentifikasi objek, individu, pencegah, dan elemen visual lainnya dengan sempurna

Shaip hubungi kami

Ingin membuat kumpulan data audio Anda sendiri?

Terhubung dengan pakar pengumpulan data ucapan internal kami untuk menyiapkan repositori audio yang paling sesuai dengan kebutuhan Anda

  • Dengan mendaftar, saya setuju dengan Shaip Kebijakan Privasi dan Ketentuan Layanan dan memberikan persetujuan saya untuk menerima komunikasi pemasaran B2B dari Shaip.

Pengumpulan Data Ucapan untuk Model ML mengacu pada proses pengumpulan rekaman audio bahasa lisan. Koleksi ini membantu dalam pelatihan dan menyempurnakan algoritme pembelajaran mesin, khususnya yang berpusat pada pemahaman dan pemrosesan suara manusia.

Saat ingin mengumpulkan data audio untuk Pengenalan Ucapan Otomatis (ASR), Anda harus mulai dengan menentukan kebutuhan spesifik proyek Anda, termasuk bahasa, aksen, dan jenis ucapan yang diinginkan. Setelah mengatur parameter ini, pastikan Anda mendapatkan semua izin yang diperlukan untuk menghormati privasi pengguna. Kemudian, gunakan alat perekam atau perangkat lunak yang sesuai untuk menangkap sampel audio yang jelas. Setiap rekaman harus diberi anotasi secara cermat beserta transkripsinya atau metadata terkait lainnya dan disimpan secara sistematis agar mudah diakses.

Kumpulan data ucapan dalam pembelajaran mesin sangat penting untuk pelatihan, pengujian, dan validasi model yang disesuaikan untuk mengenali, mentranskripsikan, atau menafsirkan bahasa lisan. Kumpulan data tersebut membuka jalan bagi berbagai aplikasi, mulai dari asisten suara dan layanan transkripsi hingga biometrik suara.

Untuk mengumpulkan data yang tepat dari beragam bahasa dan aksen, kolaborasi dengan penutur asli dari latar belakang linguistik yang diinginkan sangatlah penting. Bertujuan untuk mendapatkan sampel yang bervariasi dan representatif untuk mencakup spektrum demografi yang luas. Gunakan peralatan perekaman standar di lingkungan yang seragam untuk memastikan konsistensi audio. Dan yang terpenting, beri anotasi pada setiap bagian data dengan transkripsi dan metadata terperinci, yang menunjukkan bahasa dan aksen tertentu.