Studi Kasus: Kumpulan Ucapan

Menyampaikan 7M+ Ucapan untuk membangun asisten digital multibahasa dalam 13 bahasa

Solusi Dunia Nyata

Data yang mendukung percakapan global

Kebutuhan akan pelatihan Pengucapan muncul karena tidak semua pelanggan menggunakan kata atau frasa yang tepat saat berinteraksi atau mengajukan pertanyaan kepada asisten suara mereka dalam format skrip. Itu sebabnya aplikasi suara tertentu harus dilatih pada data ucapan spontan. Misalnya, “Di mana rumah sakit terdekat berada?” "Temukan rumah sakit di dekat saya" atau "Apakah ada rumah sakit terdekat?" semua menunjukkan maksud pencarian yang sama tetapi diutarakan secara berbeda.

Masalah

Untuk menjalankan peta jalan pidato Asisten Digital klien untuk bahasa di seluruh dunia, tim perlu memperoleh data pelatihan dalam jumlah besar untuk model AI pengenalan suara. Persyaratan kritis klien adalah:

Memperoleh data pelatihan dalam jumlah besar (permintaan ucapan pembicara tunggal dengan durasi tidak lebih dari 3-30 detik) untuk layanan pengenalan suara dalam 13 bahasa global
Untuk setiap bahasa, pemasok akan membuat pesan teks untuk pembicara untuk merekam (kecuali jika:
persediaan klien) dan menyalin audio yang dihasilkan.
Berikan data audio dan transkripsi ucapan yang direkam dengan file JSON yang sesuai
berisi metadata untuk semua rekaman.
Pastikan beragam pembicara berdasarkan usia, jenis kelamin, pendidikan & dialek
Pastikan campuran beragam lingkungan perekaman sesuai Spesifikasi.
Setiap rekaman audio harus setidaknya 16kHz tetapi sebaiknya 44kHz

Percepat AI Percakapan Anda
pengembangan aplikasi sebesar 100%

“Setelah mengevaluasi banyak vendor, klien memilih Shaip karena keahlian mereka dalam proyek AI percakapan. Kami terkesan dengan kompetensi pelaksanaan proyek Shaip, keahlian mereka untuk mendapatkan, menyalin, dan menyampaikan ucapan yang diperlukan dari ahli bahasa ahli dalam 13 bahasa dalam waktu yang ketat dan dengan kualitas yang dibutuhkan”

Solusi

Dengan pemahaman mendalam kami tentang AI percakapan, kami membantu klien mengumpulkan, menyalin, dan membuat anotasi data dengan tim ahli bahasa dan annotator untuk melatih Suite Suara multibahasa Pemrosesan Suara yang didukung AI.

Lingkup pekerjaan untuk Shaip termasuk tetapi tidak terbatas pada memperoleh volume besar data pelatihan audio untuk pengenalan suara, menyalin rekaman audio dalam berbagai bahasa untuk semua bahasa di peta jalan bahasa Tingkat 1 dan Tingkat 2 kami, dan mengirimkan yang sesuai JSON file yang berisi metadata. Shaip mengumpulkan ucapan dalam skala 3-30 detik sambil mempertahankan tingkat kualitas yang diinginkan yang diperlukan untuk melatih model ML untuk proyek yang kompleks.

Audio Dikumpulkan, Ditranskripsi & Dianotasi: 22,250 jam
Bahasa yang Didukung: 13 (Denmark, Korea, Arab Saudi, Belanda, Cina Daratan & Taiwan, Prancis Kanada, Spanyol Meksiko, Turki, Hindi, Polandia, Jepang, Rusia)
Jumlah Ucapan: 7M +
Timeline: 7-8 bulan

Saat mengumpulkan ucapan audio pada 16 kHz, kami memastikan perpaduan yang sehat antara pembicara berdasarkan usia, jenis kelamin, pendidikan, dan dialek di lingkungan perekaman yang beragam.

Hasil

Data audio ucapan berkualitas tinggi dari ahli bahasa memberdayakan klien untuk secara akurat melatih model Pengenalan Ucapan multibahasa mereka dalam 13 bahasa Tingkat 1 & 2 Global. Dengan kumpulan data pelatihan standar emas, klien dapat menawarkan bantuan digital yang cerdas dan kuat untuk memecahkan masalah dunia nyata di masa depan.

Keahlian kami

Jam Pidato Dikumpulkan

0 +

Tim Pengumpul Data Suara

Sesuai PII

0 %

Nomor Keren

0 +

Penerimaan & Akurasi Data

> 0

Pelanggan Fortune 500

0 +

Sumber Daya yang Direkomendasikan

Panduan Pembeli

Panduan Pembeli: AI Percakapan

Chatbot yang Anda ajak bicara berjalan pada sistem AI percakapan canggih yang dilatih, diuji, dan dibuat menggunakan banyak kumpulan data pengenalan suara.

Blog

Keadaan Percakapan AI 2021

Infografis AI Percakapan 2021 berbicara tentang apa itu AI Percakapan, evolusinya, jenisnya, Pasar AI Percakapan berdasarkan Wilayah, Kasus Penggunaan, tantangan, dll.

Blog

3 Hambatan pada Evolusi AI Percakapan

Shaip memulai evolusi AI percakapan sebagai alat keterlibatan pelanggan dengan menawarkan data audio beranotasi yang diperlukan dalam 50+ bahasa.

Membuat NLP klinis adalah tugas penting yang membutuhkan keahlian domain yang luar biasa untuk dipecahkan. Saya dapat melihat dengan jelas bahwa Anda beberapa tahun di depan Google dalam bidang ini. Saya ingin bekerja dengan Anda dan mengukur Anda.

Google, Inc. Kepala

Tim teknik saya bekerja dengan tim Shaip selama 2+ tahun selama pengembangan API pidato perawatan kesehatan. Kami terkesan dengan pekerjaan mereka dalam NLP khusus perawatan kesehatan dan apa yang dapat mereka capai dengan kumpulan data yang kompleks.

Google, Inc. Kepala Bagian Teknik

Beri tahu kami bagaimana kami dapat membantu inisiatif AI Anda berikutnya.

Studi Kasus: Kumpulan Ucapan

Menyampaikan 7M+ Ucapan untuk membangun asisten digital multibahasa dalam 13 bahasa

Solusi Dunia Nyata

Masalah

Solusi

Hasil

Keahlian kami

Sumber Daya yang Direkomendasikan

Panduan Pembeli

Panduan Pembeli: AI Percakapan

Blog

Keadaan Percakapan AI 2021

Blog

3 Hambatan pada Evolusi AI Percakapan

Layanan Data AI

Khusus

Industri

Produk

Perusahaan

Sumber

Hubungi Kami

Beri tahu kami lebih banyak tentang Anda!

Beri tahu kami lebih banyak tentang Anda!

Beri tahu kami lebih banyak tentang Anda!

Beri tahu kami lebih banyak tentang Anda!

Beri tahu kami lebih banyak tentang Anda!

Beri tahu kami lebih banyak tentang Anda!