Visi Komputer

22+ Kumpulan Data Open-Source Paling Banyak Dicari untuk Computer Vision

Algoritme AI hanya sebagus data yang Anda berikan.

Ini bukan pernyataan yang berani atau tidak konvensional. AI mungkin tampak agak mengada-ada beberapa dekade yang lalu, tetapi Kecerdasan Buatan dan Pembelajaran Mesin telah berkembang sangat jauh sejak saat itu.

Visi komputer membantu komputer memahami dan menafsirkan label dan gambar. Saat Anda melatih komputer menggunakan jenis gambar yang tepat, komputer dapat memperoleh kemampuan untuk mendeteksi, memahami, dan mengidentifikasi berbagai fitur wajah, mendeteksi penyakit, mengendarai kendaraan otonom, dan juga menyelamatkan nyawa menggunakan pemindaian organ multidimensi.

Pasar Computer Vision diprediksi akan mencapai $ 144.46 Billion pada tahun 2028 dari $7.04 Miliar pada tahun 2020, tumbuh pada CAGR sebesar 45.64% antara tahun 2021 dan 2028.

Beberapa kasus penggunaan visi komputer adalah:

  • Pencitraan medis
  • Kendaraan otonom
  • Pengenalan wajah dan objek
  • Identifikasi cacat
  • Deteksi pemandangan

Grafik kumpulan data gambar Anda memberi makan dan melatih Pembelajaran Mesin dan tugas visi komputer Anda sangat penting untuk keberhasilan proyek AI Anda. Dataset yang berkualitas cukup sulit didapat. Bergantung pada kerumitan proyek Anda, diperlukan waktu antara beberapa hari hingga beberapa minggu untuk mendapatkan kumpulan data yang andal dan relevan untuk tujuan visi komputer.

Di sini, kami memberi Anda berbagai (dikategorikan untuk kemudahan Anda) kumpulan data sumber terbuka yang dapat Anda gunakan segera.

Daftar Lengkap Kumpulan Data Computer Vision

Umum:

  1. IMAGEnet (Tautan)

    ImageNet adalah kumpulan data yang banyak digunakan, dan dilengkapi dengan 1.2 juta gambar yang dikategorikan ke dalam 1000 kategori. Dataset ini diatur sesuai dengan hierarki WorldNet dan dikategorikan menjadi tiga bagian – data pelatihan, label gambar, dan data validasi.

  2. Kinetika 700 (Tautan)

    Kinetics 700 adalah kumpulan data berkualitas tinggi yang sangat besar dengan lebih dari 650,000 klip dari 700 kelas tindakan manusia yang berbeda. Setiap tindakan kelas memiliki sekitar 700 klip video. Klip dalam kumpulan data memiliki interaksi manusia-objek dan manusia-manusia, yang terbukti cukup membantu saat mengenali tindakan manusia dalam video.

  3. CIFAR-10 (Tautan)

    CIFAR 10 adalah salah satu kumpulan data visi komputer terbesar yang memiliki 60000 gambar berwarna 32 x 32 yang mewakili sepuluh kelas yang berbeda. Setiap kelas memiliki sekitar 6000 gambar yang digunakan untuk melatih algoritma computer vision dan pembelajaran mesin.

Pengenalan wajah:

Pengenalan wajah

  1. Wajah Berlabel di Alam Liar (Tautan)

    Labeled Faced in the Wild adalah kumpulan data besar yang berisi lebih dari 13,230 gambar dari hampir 5,750 orang yang terdeteksi dari internet. Kumpulan data wajah ini dirancang untuk memudahkan mempelajari deteksi wajah tanpa batasan.

  2. WebFace CASIA (Tautan)

    Wajah Web CASIA adalah kumpulan data yang dirancang dengan baik yang membantu pembelajaran mesin dan penelitian ilmiah tentang pengenalan wajah tanpa batasan. Dengan lebih dari 494,000 gambar dari hampir 10,000 identitas asli, ini sangat ideal untuk tugas identifikasi dan verifikasi wajah.

  3. UMD Menghadapi Dataset (Tautan)

    UMD menghadapi kumpulan data yang dianotasi dengan baik yang berisi dua bagian – gambar diam dan bingkai video. Kumpulan data memiliki lebih dari 367,800 anotasi wajah dan 3.7 juta bingkai video beranotasi dari subjek.

Pengenalan tulisan tangan:

  1. Basis Data MNIST (Tautan)

    MNIST adalah database yang berisi sampel angka tulisan tangan dari 0 hingga 9, dan memiliki 60,000 dan 10,000 gambar pelatihan dan pengujian. Dirilis pada tahun 1999, MNIST mempermudah pengujian sistem pemrosesan gambar di Deep Learning.

  2. Kumpulan Data Karakter Buatan (Tautan)

    Dataset Karakter Buatan adalah, seperti namanya, data yang dihasilkan secara artifisial yang menggambarkan struktur bahasa Inggris dalam sepuluh huruf kapital. Muncul dengan lebih dari 6000 gambar.

Mari diskusikan kebutuhan Data Pelatihan AI Anda hari ini.

Deteksi Objek:

  1. MS COCO (Tautan)

    MS COCO atau Common Objects in Context adalah dataset deteksi objek dan teks.

    Ini memiliki lebih dari 328,000 gambar dengan deteksi keypoint, deteksi multi-objek, teks, dan anotasi topeng segmentasi. Muncul dengan 80 kategori objek dan lima teks per gambar.

  2. LSUN(Tautan)

    LSUN, kependekan dari Large-scale Scene Understanding, memiliki lebih dari satu juta gambar berlabel di 20 objek dan 10 kategori pemandangan. Beberapa kategori memiliki hampir 300,000 gambar, dengan 300 gambar khusus untuk validasi dan 1000 gambar untuk data pengujian.

  3. Objek Rumah(Tautan)

    Kumpulan data Objek Rumah berisi gambar beranotasi dari objek acak dari sekitar rumah – dapur, ruang tamu, dan kamar mandi. Kumpulan data ini juga memiliki beberapa video beranotasi dan 398 foto tanpa anotasi yang dirancang untuk pengujian.

Otomotif:

  1. Kumpulan data lanskap kota (Tautan)

    Cityscape adalah kumpulan data yang harus dikunjungi ketika mencari berbagai rangkaian video yang direkam dari beberapa adegan jalanan di beberapa kota. Gambar-gambar ini diambil dalam waktu yang lama dan dalam cuaca dan kondisi cahaya yang berbeda. Anotasi untuk 30 kelas gambar dibagi menjadi delapan kategori berbeda.

  2. Drive Dalam Barkley (Tautan)

    Barkley DeepDrive dirancang khusus untuk pelatihan kendaraan otonom, dan memiliki lebih dari 100 ribu urutan video beranotasi. Ini adalah salah satu data pelatihan yang paling membantu untuk kendaraan otonom dengan perubahan jalan dan kondisi mengemudi.

  3. Mapilari (Tautan)

    Mapillary memiliki lebih dari 750 juta pemandangan jalan dan rambu lalu lintas di seluruh dunia, yang sangat berguna dalam melatih model persepsi visual dalam pembelajaran mesin dan algoritme AI. Ini memungkinkan Anda mengembangkan kendaraan otonom yang memenuhi berbagai kondisi pencahayaan dan cuaca serta sudut pandang.

Pencitraan medis:

  1. Dataset Riset Terbuka Covid-19 (Tautan)

    Dataset asli ini memiliki sekitar 6500 piksel-poligonal segmentasi paru-paru tentang rontgen dada AP/PA. Selain itu, tersedia 517 gambar rontgen pasien Covid-19 dengan tag yang berisi nama, lokasi, detail rawat inap, hasil, dan lainnya.

  2. Database NIH dari 100,000 Rontgen Dada (Tautan)

    Basis data NIH adalah salah satu kumpulan data paling luas yang tersedia untuk umum yang berisi 100,000 gambar rontgen dada dan data terkait yang berguna bagi komunitas ilmiah dan penelitian. Bahkan memiliki gambar pasien dengan kondisi paru-paru lanjut.

  3. Atlas Patologi Digital (Tautan)

    Atlas of Digital Pathology menawarkan beberapa gambar patch histopatologi, lebih dari 17,000 total, dari hampir 100 slide beranotasi dari organ yang berbeda. Dataset ini berguna dalam mengembangkan visi komputer dan perangkat lunak pengenalan pola.

Pengenalan Adegan:

Pengenalan adegan

  1. Pengenalan Pemandangan Dalam Ruangan (Tautan)

    Pengenalan Pemandangan Dalam Ruangan adalah kumpulan data yang sangat dikategorikan dengan hampir 15620 gambar objek dan pemandangan dalam ruangan untuk digunakan dalam pembelajaran mesin dan pelatihan data. Muncul dengan lebih dari 65 kategori, dan setiap kategori memiliki minimal 100 gambar.

  2. xLihat (Tautan)

    Sebagai salah satu kumpulan data paling terkenal yang tersedia untuk umum, xView berisi banyak gambar overhead beranotasi dari berbagai adegan yang kompleks dan besar. Memiliki sekitar 60 kelas dan lebih dari satu juta instance objek, tujuan dari kumpulan data ini adalah untuk memberikan bantuan bencana yang lebih baik menggunakan citra satelit.

  3. Tempat (Tautan)

    Places, kumpulan data yang disumbangkan oleh MIT, memiliki lebih dari 1.8 juta gambar dari 365 kategori pemandangan yang berbeda. Ada sekitar 50 gambar di masing-masing kategori ini untuk validasi dan 900 gambar untuk pengujian. Mempelajari fitur adegan dalam untuk menetapkan pengenalan adegan atau tugas pengenalan visual dimungkinkan.

Hiburan:

  1. Kumpulan Data WIKI IMDB (Tautan)

    IMDB – Wiki adalah salah satu database publik paling populer tentang wajah yang diberi label cukup umur, jenis kelamin, dan nama. Ini juga memiliki sekitar 20 ribu wajah selebriti dan 62 ribu dari Wikipedia.

  2. Wajah Selebriti (Tautan)

    Celeb Faces adalah database skala besar dengan 200,000 gambar beranotasi dari selebriti. Gambar datang dengan kebisingan latar belakang dan variasi pose, menjadikannya berharga untuk set tes pelatihan dalam tugas visi komputer. Ini sangat bermanfaat untuk mencapai akurasi yang lebih tinggi dalam pengenalan wajah, pengeditan, pelokalan bagian wajah, dan banyak lagi.

Sekarang Anda memiliki daftar besar kumpulan data gambar sumber terbuka untuk mengisi mesin kecerdasan buatan Anda. Hasil dari model AI dan pembelajaran mesin Anda terutama bergantung pada kualitas set data yang Anda berikan dan latih. Jika Anda ingin model AI Anda menampilkan prediksi yang akurat, model tersebut memerlukan kumpulan data berkualitas yang dikumpulkan, diberi tag, dan diberi label dengan sempurna. Untuk memperkuat keberhasilan sistem visi komputer Anda, Anda harus menggunakan database gambar berkualitas yang relevan dengan visi proyek Anda. Jika Anda mencari lebih banyak kumpulan data seperti itu Klik disini

sosial Share

Anda Mungkin Juga Suka