Studi Kasus: Moderasi Konten

30K+ dokumen web dihapus & dianotasi untuk Moderasi Konten

Moderasi konten - spanduk

Ada peningkatan permintaan untuk moderasi konten bertenaga AI yang berupaya mengamankan ruang daring tempat kita terhubung & berkomunikasi.

Seiring dengan terus meningkatnya penggunaan media sosial, masalah perundungan siber muncul sebagai rintangan signifikan bagi platform yang berupaya memastikan ruang daring yang aman. Sebanyak 38% individu menghadapi perilaku merugikan ini setiap hari, yang menekankan permintaan mendesak akan pendekatan moderasi konten yang inovatif. Saat ini, berbagai organisasi mengandalkan penggunaan kecerdasan buatan untuk mengatasi masalah perundungan siber yang terus berlanjut secara proaktif.

Keamanan cyber:

Laporan Penegakan Standar Komunitas Q4 Facebook mengungkapkan – tindakan terhadap 6.3 juta konten intimidasi dan pelecehan, dengan tingkat deteksi proaktif sebesar 49.9%

Pendidikan:

2021 Studi menemukan itu 36.5% dari para siswa di Amerika Serikat yang berusia antara 12 & 17 tahun mengalami cyberbullying pada satu titik atau lainnya selama sekolah mereka.

Menurut laporan tahun 2020, pasar solusi moderasi konten global bernilai USD 4.07 miliar pada tahun 2019 dan diperkirakan akan mencapai USD 11.94 miliar pada tahun 2027, dengan CAGR 14.7%.

Solusi Dunia Nyata

Data yang memoderasi percakapan global

Klien tengah mengembangkan model Pembelajaran Mesin moderasi konten otomatis yang tangguh untuk penawaran Cloud-nya, dan mereka mencari vendor khusus domain yang dapat membantu mereka dengan data pelatihan yang akurat.

Memanfaatkan pengetahuan kami yang luas dalam pemrosesan bahasa alami (NLP), kami membantu klien dalam mengumpulkan, mengkategorikan, dan membuat anotasi lebih dari 30,000 dokumen dalam bahasa Inggris dan Spanyol untuk membangun moderasi konten otomatis Model Pembelajaran Mesin yang bercabang menjadi konten Beracun, Dewasa, atau Eksplisit Seksual kategori.

Solusi dunia nyata

Masalah

  • Web mengorek 30,000 dokumen dalam bahasa Spanyol dan Inggris dari domain yang diprioritaskan
  • Mengkategorikan konten yang dikumpulkan menjadi segmen pendek, sedang, dan panjang
  • Memberi label pada data yang dikompilasi sebagai konten beracun, dewasa, atau eksplisit secara seksual
  • Memastikan anotasi berkualitas tinggi dengan akurasi minimal 90%.

Solusi

  • Web Memotong 30,000 dokumen masing-masing untuk bahasa Spanyol & Inggris dari BFSI, Perawatan Kesehatan, Manufaktur, Ritel. Konten selanjutnya dibagi menjadi dokumen pendek, sedang & panjang 
  • Berhasil melabeli konten yang diklasifikasikan sebagai konten beracun, dewasa, atau eksplisit secara seksual
  • Untuk mencapai kualitas 90%, Shaip menerapkan proses kontrol kualitas dua tingkat:
    » Level 1: Quality Assurance Check: 100% dari file yang akan divalidasi.
    » Level 2: Analisis Kualitas Kritis Periksa: Tim CQA Shaips untuk menilai 15%-20% dari sampel retrospektif.

Hasil

Data pelatihan membantu membangun model ML moderasi konten otomatis yang dapat menghasilkan beberapa hasil yang bermanfaat untuk menjaga lingkungan online yang lebih aman. Beberapa hasil utama meliputi:

  • Efisiensi untuk memproses data dalam jumlah besar
  • Konsistensi dalam memastikan penegakan kebijakan moderasi yang seragam
  • Skalabilitas untuk beradaptasi dengan pertumbuhan basis pengguna dan volume konten
  • Moderasi Real-time dapat mengidentifikasi &
    menghapus konten yang berpotensi berbahaya saat dibuat
  • Efektivitas biaya dengan mengurangi ketergantungan pada moderator manusia

Beri tahu kami bagaimana kami dapat membantu inisiatif AI Anda berikutnya.