Studi Kasus: Kumpulan Ucapan

Menyampaikan 7M+ Ucapan untuk membangun asisten digital multibahasa dalam 13 bahasa

Koleksi Ucapan

Solusi Dunia Nyata

Data yang mendukung percakapan global

Kebutuhan akan pelatihan Pengucapan muncul karena tidak semua pelanggan menggunakan kata atau frasa yang tepat saat berinteraksi atau mengajukan pertanyaan kepada asisten suara mereka dalam format skrip. Itu sebabnya aplikasi suara tertentu harus dilatih pada data ucapan spontan. Misalnya, “Di mana rumah sakit terdekat berada?” "Temukan rumah sakit di dekat saya" atau "Apakah ada rumah sakit terdekat?" semua menunjukkan maksud pencarian yang sama tetapi diutarakan secara berbeda.

Koleksi Ucapan1

Masalah

Untuk menjalankan peta jalan pidato Asisten Digital klien untuk bahasa di seluruh dunia, tim perlu memperoleh data pelatihan dalam jumlah besar untuk model AI pengenalan suara. Persyaratan kritis klien adalah:

  • Memperoleh data pelatihan dalam jumlah besar (permintaan ucapan pembicara tunggal dengan durasi tidak lebih dari 3-30 detik) untuk layanan pengenalan suara dalam 13 bahasa global
  • Untuk setiap bahasa, pemasok akan membuat pesan teks untuk pembicara untuk merekam (kecuali jika:
    persediaan klien) dan menyalin audio yang dihasilkan.
  • Berikan data audio dan transkripsi ucapan yang direkam dengan file JSON yang sesuai
    berisi metadata untuk semua rekaman.
  • Pastikan beragam pembicara berdasarkan usia, jenis kelamin, pendidikan & dialek
  • Pastikan campuran beragam lingkungan perekaman sesuai Spesifikasi.
  • Setiap rekaman audio harus setidaknya 16kHz tetapi sebaiknya 44kHz

Percepat AI Percakapan Anda
pengembangan aplikasi sebesar 100%

“Setelah mengevaluasi banyak vendor, klien memilih Shaip karena keahlian mereka dalam proyek AI percakapan. Kami terkesan dengan kompetensi pelaksanaan proyek Shaip, keahlian mereka untuk mendapatkan, menyalin, dan menyampaikan ucapan yang diperlukan dari ahli bahasa ahli dalam 13 bahasa dalam waktu yang ketat dan dengan kualitas yang dibutuhkan”

Solusi

Dengan pemahaman mendalam kami tentang AI percakapan, kami membantu klien mengumpulkan, menyalin, dan membuat anotasi data dengan tim ahli bahasa dan annotator untuk melatih Suite Suara multibahasa Pemrosesan Suara yang didukung AI.

Lingkup pekerjaan untuk Shaip termasuk tetapi tidak terbatas pada memperoleh volume besar data pelatihan audio untuk pengenalan suara, menyalin rekaman audio dalam berbagai bahasa untuk semua bahasa di peta jalan bahasa Tingkat 1 dan Tingkat 2 kami, dan mengirimkan yang sesuai JSON file yang berisi metadata. Shaip mengumpulkan ucapan dalam skala 3-30 detik sambil mempertahankan tingkat kualitas yang diinginkan yang diperlukan untuk melatih model ML untuk proyek yang kompleks.

  • Audio Dikumpulkan, Ditranskripsi & Dianotasi: 22,250 jam
  • Bahasa yang Didukung: 13 (Denmark, Korea, Arab Saudi, Belanda, Cina Daratan & Taiwan, Prancis Kanada, Spanyol Meksiko, Turki, Hindi, Polandia, Jepang, Rusia)
  • Jumlah Ucapan: 7M +
  • Timeline: 7-8 bulan

Saat mengumpulkan ucapan audio pada 16 kHz, kami memastikan perpaduan yang sehat antara pembicara berdasarkan usia, jenis kelamin, pendidikan, dan dialek di lingkungan perekaman yang beragam.

Hasil

Data audio ucapan berkualitas tinggi dari ahli bahasa yang ahli memberdayakan klien untuk melatih secara akurat
model Pengenalan Ucapan multibahasa mereka dalam 13 bahasa Tingkat 1 & 2 Global. Dengan set data pelatihan standar emas, klien dapat menawarkan bantuan digital yang cerdas dan kuat untuk memecahkan masalah dunia nyata di masa depan.

Keahlian kami

0 +
Jam Pidato Dikumpulkan
0
Tim Pengumpul Data Suara
0 %
Sesuai PII
0 +
Nomor Keren
> 0
Penerimaan & Akurasi Data
0 +
Pelanggan Fortune 500

Beri tahu kami bagaimana kami dapat membantu inisiatif AI Anda berikutnya.