fbpx

Apakah Pembelajaran Mesin?

Kongsi di facebook
Kongsi
Kongsi di linkedin
Kongsi
Kongsi di twitter
Tweet
tengah

Apakah Pembelajaran Mesin, dan bagaimana ia berfungsi?
Pembelajaran mesin ialah satu cabang sains komputer yang cuba mengajar komputer cara belajar dan beroperasi tanpa perlu diprogramkan secara langsung. Pembelajaran mesin, khususnya, ialah kaedah analisis data yang memerlukan penciptaan dan pengemaskinian model yang membolehkan program "belajar" melalui pengalaman. Pembelajaran mesin memerlukan penciptaan algoritma yang mengubah model untuk meningkatkan ketepatan ramalan.

Program komputer dikatakan belajar daripada pengalaman E berkenaan dengan beberapa tugas T dan beberapa ukuran prestasi P, menurut Tom Mitchell, profesor Sains Komputer dan Pembelajaran Mesin di Carnegie Mellon, jika prestasinya pada T, seperti yang diukur oleh P, bertambah baik. dengan pengalaman E. Jika program bertambah baik dalam menyelesaikan masalah dengan pengalaman, ia dikatakan menggunakan pembelajaran mesin.

Pembelajaran mesin pada asalnya digunakan dan dibincangkan pada tahun 1950-an, dan penerimaannya telah meningkat dengan ketara dalam tempoh sepuluh tahun yang lalu. Pengenalpastian imej, pemprosesan bahasa semula jadi, reka bentuk kecerdasan buatan, teknologi kereta pandu sendiri dan algoritma carian web Google adalah semua contoh aplikasi pembelajaran mesin.

Kecerdasan Buatan lwn Pembelajaran Mesin

Perbezaan antara pembelajaran mesin dan kecerdasan buatan harus dititikberatkan. Pembelajaran mesin ialah satu cabang sains komputer yang memfokuskan pada membangunkan algoritma. Program dan komputer pintar buatan boleh dibuat dan direka bentuk menggunakan kaedah ini untuk reka bentuk algoritma.

Aplikasi dan Contoh Pembelajaran Mesin

Pembelajaran mesin adalah kedua-dua bidang penyelidikan dan kaedah untuk menyelesaikan masalah. Teknik pembelajaran mesin juga boleh digunakan untuk pelbagai aplikasi. Berikut ialah beberapa contoh cara strategi dan kaedah pembelajaran mesin boleh digunakan:

Pemprosesan Bahasa Asli

Pemprosesan bahasa semulajadi (NLP) adalah cabang sains komputer yang mengkaji interaksi komputer dengan bahasa semula jadi (manusia). Pengecaman pertuturan, pemahaman bahasa semula jadi, dan penjanaan bahasa semula jadi adalah semua aspek penting dalam pemprosesan bahasa semula jadi. Setiap sektor ini boleh mendapat manfaat daripada teknik pembelajaran mesin.

Analisis Tuntutan Insurans

Pembelajaran mesin digunakan dalam sektor insurans dalam pelbagai cara. Beberapa organisasi, terutamanya, menggunakan algoritma pembelajaran mesin untuk meramalkan tuntutan masa depan, yang kemudiannya digunakan untuk menetapkan premium insurans. Selain itu, pembelajaran mesin sedang digunakan oleh beberapa syarikat insurans dan perbankan untuk mengesan penipuan.

Diagnosis Perubatan dan Bioinformatik

Jumlah data biologi yang dikumpul oleh penyelidik meningkat pada kelajuan yang sangat pantas. Ini telah mengakibatkan isu dengan penyimpanan dan pentadbiran data, serta kapasiti untuk mengekstrak maklumat yang berkaitan daripadanya. Algoritma pembelajaran mesin kini sedang dibangunkan untuk menyimpan data biologi dengan murah dan berkesan, serta untuk mengekstrak makna daripada data secara bijak.

Pembelajaran mesin dan teknik pengecaman corak juga digunakan pada maklumat perubatan dalam usaha untuk mengklasifikasikan dan memahami pelbagai gangguan dengan lebih baik. Kaedah ini juga dijangka membantu dalam diagnosis penyakit dengan mengenal pasti kumpulan populasi yang paling terdedah kepada penyakit tertentu.

Pengecaman Corak dan Pemprosesan Imej

Tanpa teknik pembelajaran mesin, menggunakan komputer untuk mengenal pasti corak dan objek dalam foto, filem dan aset media lain adalah kurang praktikal. Jika anda perlu menulis kod individu untuk setiap objek yang anda ingin kenali, menulis atur cara untuk mengesan objek di dalam imej akan menjadi tidak praktikal.

Algoritma pengecaman imej, juga dikenali sebagai pengelas imej, boleh dilatih untuk mengkategorikan gambar berdasarkan kandungannya. Algoritma ini diasah dengan menganalisis sejumlah besar foto yang dikategorikan sebelum ini. Sistem ini bertambah baik dengan menaik taraf model mereka setiap kali mereka memproses imej baharu, berdasarkan persamaan dan perbezaan foto sebelumnya yang telah mereka proses. Pembelajaran mendalam ialah sejenis pembelajaran mesin yang digunakan dalam pemprosesan imej dan biasanya dilakukan dengan rangkaian saraf tiruan.

Enjin Carian

Pembelajaran mendalam juga bermanfaat untuk carian web, kerana ia meningkatkan hasil carian dan membantu untuk memahami pertanyaan pengguna dengan lebih baik. Syarikat seperti Google boleh meningkatkan hasil carian mereka dan mempelajari set hasil yang optimum untuk pertanyaan tertentu dengan menilai tingkah laku pengguna terhadap pertanyaan dan hasil yang disampaikan. Teknik pembelajaran mesin juga digunakan untuk menghasilkan cadangan carian dan pembetulan ejaan berdasarkan pertanyaan agregat daripada semua pengguna.

Analisis Pasaran Kewangan

Dalam pasaran kewangan, perdagangan algoritma dan analisis pasaran telah menjadi aplikasi biasa dalam pembelajaran mesin dan kecerdasan buatan. Algoritma pembelajaran mendalam kini digunakan oleh pengurus dana untuk melihat arah aliran dan juga melaksanakan transaksi. Dana dan pedagang yang menggunakan teknik automatik ini untuk mengenali corak dan melaksanakan dagangan boleh membuat dagangan jauh lebih pantas daripada yang mereka boleh lakukan jika mereka menggunakan pendekatan manusia.

Aplikasi Pembelajaran Mesin Tambahan

Pembelajaran mesin mempunyai aplikasi yang hampir tidak berkesudahan kerana ia pada asasnya kaedah saintifik untuk penyelesaian masalah. Teknik pembelajaran mesin juga digunakan dalam sains genetik untuk klasifikasi jujukan DNA, perbankan untuk pengesanan penipuan, pengiklanan internet untuk kesempurnaan penyasaran iklan, dan banyak lagi industri untuk meningkatkan kecekapan dan kemahiran pemprosesan data, sebagai tambahan kepada kegunaan yang disenaraikan di atas.

Apakah Pembelajaran Mesin dan Bagaimana Ia Berfungsi?

Pembelajaran mesin jelas digunakan dalam pelbagai cara hari ini. Namun, bagaimanakah ia digunakan? Apakah sebenarnya yang program ini lakukan untuk membantu orang ramai menyelesaikan masalah dengan lebih berkesan? Apakah yang membezakan pendekatan ini daripada kaedah penyelesaian masalah sebelumnya?

Pembelajaran mesin, seperti yang dinyatakan sebelum ini, adalah satu cabang sains komputer yang cuba membolehkan komputer belajar tanpa diajar secara eksplisit. Kaedah atau algoritma yang digunakan oleh perisian untuk "belajar" ditentukan oleh jenis masalah atau tugas yang ingin diselesaikannya.
Memahami jenis masalah yang ingin ditangani oleh pembelajaran mesin dan kemudian melihat cara ia cuba menyelesaikan masalah tersebut ialah kaedah terbaik untuk memahami cara ia berfungsi. Pertama, senarai cabaran yang direka bentuk untuk diselesaikan oleh pembelajaran mesin:

Tugasan Pembelajaran Mesin Terdapat Beberapa Jenis Tugasan Pembelajaran Mesin

Apabila lebih banyak set data diproses, algoritma pembelajaran mesin berusaha untuk mempelajari dan meningkatkan ketepatannya. Jumlah input yang disediakan oleh algoritma pembelajaran mesin kepada sistem ialah satu kaedah untuk mengklasifikasikan kerja yang mereka selesaikan. Dalam sesetengah kes, komputer diberikan sejumlah besar data latihan berlabel, yang dirujuk sebagai pembelajaran terselia. Dalam keadaan lain, tiada data berteg disediakan, yang dirujuk sebagai pembelajaran tanpa pengawasan. Akhir sekali, beberapa data latihan berlabel disediakan dalam pembelajaran separa penyeliaan, tetapi majoriti data latihan tidak dilabelkan. Mari kita lihat dengan lebih dekat setiap jenis:

Pembelajaran yang diselia

Jenis pembelajaran mesin yang paling praktikal dan digunakan secara meluas ialah pembelajaran diselia. Ia memerlukan membangunkan fungsi matematik yang menghubungkan pembolehubah input kepada pembolehubah output yang dikehendaki. Sebilangan besar set data latihan berlabel disediakan, yang berfungsi sebagai contoh data yang akan diproses oleh komputer.

Di samping itu, tugas pembelajaran yang diselia boleh diklasifikasikan sebagai isu "pengkelasan" atau "regresi". Cabaran klasifikasi menjana pengkategorian menggunakan kaedah klasifikasi statistik, seperti "hot dog" atau "bukan hot dog." Sebaliknya, masalah regresi menggunakan analisis regresi statistik untuk mendapatkan keputusan berangka.

Pembelajaran yang separa seliaan

Pembelajaran separa penyeliaan adalah serupa dengan pembelajaran diselia, kecuali hanya sebahagian kecil data latihan yang dilabelkan.
Pembelajaran separa penyeliaan dicontohi oleh pengecaman imej. Dalam kes ini, kami mungkin memberi sistem beberapa gambar berteg yang mengandungi item yang kami mahu ia kenali, kemudian melatihnya pada sejumlah besar imej tidak berlabel.

Belajar Tanpa Pengawasan

Semua input dalam tugas pembelajaran tanpa pengawasan tidak dilabelkan, dan algoritma mesti membina struktur daripada input itu sendiri. Tugas pembelajaran tanpa pengawasan yang berusaha untuk mendedahkan kumpulan dalam set data input dikenali sebagai isu pengelompokan (atau cabaran analisis kelompok). Corak dalam data stok atau trend pengguna ialah dua contoh. Masalah pembelajaran tanpa pengawasan juga secara rutin diselesaikan menggunakan rangkaian saraf.

Algoritma Penyelesaian Masalah dan Algoritma Pembelajaran Mesin

Algoritma ialah kaedah untuk menangani masalah, dan pembelajaran mesin menyediakan pelbagai kaedah untuk mengendalikan pelbagai masalah. Senarai beberapa algoritma dan metodologi yang paling popular dan membantu yang digunakan dalam aplikasi pembelajaran mesin hari ini boleh didapati di bawah. Perlu diingat bahawa apl akan sering menggabungkan banyak cara ini untuk menangani masalah:

Rangkaian Neural Tiruan ialah sejenis rangkaian saraf tiruan.

Model pengiraan berdasarkan rangkaian saraf biologi, seperti otak manusia, dikenali sebagai rangkaian saraf tiruan. Ia memproses isyarat input atau fail melalui urutan fungsi sebelum menterjemahkannya ke dalam output yang dikehendaki. Teknologi ini digunakan secara meluas dalam pengecaman gambar hari ini, terjemahan bahasa dan aplikasi lain.
Belajar dari Bawah Atas

Pembelajaran mendalam ialah istilah yang digunakan untuk menerangkan sekumpulan teknik pembelajaran mesin yang sangat bergantung pada rangkaian saraf tiruan. Algoritma pembelajaran mendalam digambarkan sebagai menggunakan rangkaian saraf yang sangat dalam oleh Jeff Dean dalam Google Tech Talk 2016, dengan "deep" merujuk kepada bilangan lapisan, atau lelaran antara input dan output. Algoritma pembelajaran dalam aplikasi hari ini berkembang "lebih mendalam" kerana kuasa pemprosesan menjadi lebih murah.

Analisis Kluster

Analisis kelompok bertujuan untuk menyusun objek ke dalam "kelompok" item yang lebih serupa daripada item dalam kelompok lain. Cara perkara serupa ditentukan oleh input data yang diterima oleh perisian komputer. Tiada latihan dibekalkan kerana analisis kelompok paling kerap digunakan dalam masalah pembelajaran tanpa pengawasan.

Program ini akan mencirikan setiap objek input menggunakan apa sahaja titik data yang disediakan dan membandingkan nilai dengan data tentang perkara yang telah dinilai sebelum ini. Algoritma boleh mula mengumpulkan item dan menemui kelompok setelah objek yang mencukupi telah dianalisis untuk mengesan kumpulan dalam titik data dan objek.

Pengelompokan bukan satu prosedur; sebenarnya, terdapat pelbagai pendekatan untuk melakukan analisis kelompok. Dalam analisis statistik dan perlombongan data, ini adalah tugas biasa.

Rangkaian Bayesian ialah perwakilan grafik pembolehubah dan hubungannya. Rangkaian Bayesian boleh digunakan oleh algoritma pembelajaran mesin untuk membangunkan dan mencirikan sistem kepercayaan mereka. Rangkaian Bayesian digunakan dalam sistem yang mengira kebarangkalian penyakit tertentu, contohnya. Gejala boleh digunakan sebagai input dan kemungkinan penyakit sebagai output.

Pembelajaran melalui Pengukuhan

Pembelajaran pengukuhan ialah satu cabang pembelajaran mesin di mana sistem diberi maklum balas dalam bentuk insentif dan penalti dan bukannya diberitahu secara eksplisit sama ada ia "betul" atau "salah." Ini berlaku apabila penting untuk mendapatkan jawapan yang betul, tetapi juga penting untuk mencari jawapan dengan cepat.

Mencari keseimbangan antara "penerokaan" dan "eksploitasi" adalah sebahagian besar pembelajaran pengukuhan. Berapa kerapkah program harus "meneroka" untuk mendapatkan maklumat baharu dan bukannya bergantung pada maklumat yang sudah ada? Komputer boleh mengoptimumkan pendekatannya untuk mencapai keseimbangan terbaik antara penerokaan dan eksploitasi dengan "memberi ganjaran" kepada agen pembelajaran kerana berkelakuan dengan cara yang menggalakkan.

Belajar daripada Pokok Keputusan

Pembelajaran pokok keputusan ialah teknik pembelajaran mesin yang menggunakan berturut-turut kategori untuk menganalisis data dan menghasilkan output atau jawapan. Biasanya, pokok keputusan atau pokok klasifikasi menghasilkan keputusan diskret; walau bagaimanapun, pokok regresi boleh menghasilkan keputusan berterusan (biasanya nombor nyata).

Pembelajaran Mesin dengan Peraturan

Pembelajaran mesin berasaskan peraturan ialah sejenis pembelajaran mesin yang mencipta "peraturan" untuk menganalisis model, menggunakan peraturan tersebut semasa mengkaji model dan mengubah peraturan untuk meningkatkan prestasi (belajar). Kaedah ini digunakan dalam sistem imun buatan dan dalam pembangunan algoritma pembelajaran peraturan persatuan, yang akan dibincangkan seterusnya.

Peraturan Persatuan Pembelajaran

Pembelajaran peraturan persatuan ialah sejenis pembelajaran mesin yang memfokuskan pada memikirkan cara pembolehubah dalam pangkalan data berkaitan. Pemasar boleh menggunakan sejumlah besar data transaksi pasar raya untuk mencari korelasi antara pembelian produk yang berbeza, yang merupakan contoh pembelajaran peraturan persatuan yang digunakan. "Pelanggan yang membeli jeruk dan salad juga cenderung untuk membeli hirisan keju," contohnya. Pembelajaran peraturan persatuan boleh digunakan untuk mendedahkan korelasi atau "peraturan persatuan" seperti ini.

Untuk memahami pengaturcaraan logik induktif, anda mesti terlebih dahulu memahami "pengaturcaraan logik." Pengaturcaraan logik ialah paradigma pengaturcaraan di mana program ditulis sebagai urutan ungkapan yang menyatakan fakta atau peraturan, kadang-kadang dalam bentuk "jika ini, maka itu." Kita boleh mula memahami pengaturcaraan logik induktif dengan memahami bahawa "pengaturcaraan logik" adalah berdasarkan penggunaan set peraturan logik.

Pengaturcaraan logik induktif ialah cabang pengaturcaraan logik yang menggunakan kedua-dua pembelajaran mesin dan teknik pengaturcaraan logik. Maklumat latar belakang program diingati sebagai satu set peraturan logik dalam masalah ILP, yang digunakan oleh program untuk mendapatkan hipotesisnya untuk menyelesaikan masalah.

Pemprosesan bahasa semula jadi dan bioinformatik adalah dua bidang di mana pengaturcaraan logik induktif digunakan pada masa kini.

Mesin Sokongan Vektor (SVM)

Mesin vektor sokongan (SVM) ialah algoritma pembelajaran diselia yang sering digunakan untuk menyelesaikan masalah klasifikasi dan regresi. Perisian komputer mesin vektor sokongan boleh diarahkan untuk mengklasifikasikan input kepada satu daripada dua kategori. Contoh latihan bagi setiap kelas akan diserahkan kepada program, yang akan diwakili sebagai model matematik yang diplot dalam ruang berbilang dimensi (dengan bilangan dimensi ialah bilangan ciri input yang akan dinilai oleh program).

Program ini memplot perwakilan setiap kelas dalam ruang berbilang dimensi dan menentukan "satah hiper" atau sempadan yang memisahkan setiap kelas. Output input baharu akan jatuh pada satu sisi hyperplane ini apabila ia diperiksa. Kelas input ditentukan oleh sisi mana pada hyperplane output berada. Mesin vektor sokongan ialah hyperplane ini.

Belajar melalui Perwakilan

Pembelajaran perwakilan, juga dikenali sebagai pembelajaran ciri, ialah koleksi algoritma pembelajaran mesin yang membolehkan sistem menjana perwakilan sesuatu secara automatik untuk mengecam dan mengesan ciri dan kemudian membezakan antara ciri tersebut. Akibatnya, apabila ciri-ciri telah dikesan oleh sistem, mereka digunakan untuk menjalankan analisis.

Pembelajaran ciri amat popular dalam imej dan cabaran pengkategorian media lain. Oleh kerana foto, video dan jenis data lain tidak selalunya mempunyai model matematik yang mudah, membenarkan program komputer untuk membangunkan perwakilannya sendiri untuk melakukan analisis peringkat seterusnya biasanya berguna.

Belajar dengan Membanding

Pembelajaran persamaan ialah kaedah pembelajaran yang diselia yang berkait rapat dengan klasifikasi dan regresi. Walau bagaimanapun, daripada hanya mengklasifikasikan objek, tujuan kaedah pembelajaran persamaan adalah untuk menentukan sejauh mana persamaan atau perbezaan dua atau lebih perkara. Pengecaman muka pada telefon, sistem kedudukan/pengesyoran dan pengesahan suara hanyalah beberapa contoh aplikasi hari ini.

Mempelajari Kamus Jarang

Pertemuan pembelajaran kamus dengan perwakilan jarang, atau pengekodan jarang, dikenali sebagai pembelajaran kamus jarang. Matlamat program komputer adalah untuk mencipta kamus, yang merupakan perwakilan data yang dibekalkan. Algoritma pembelajaran kamus jarang menggunakan prinsip perwakilan jarang untuk mengekalkan kamus terpendek yang boleh dilaksanakan sambil menyelesaikan tugas dengan berkesan.

Algoritma Berdasarkan Proses Genetik dan Evolusi

Walaupun pembelajaran mesin telah terbukti sangat berguna dalam kajian genom manusia dan bidang sains yang berkaitan, istilah "algoritma genetik" merujuk kepada kelas algoritma pembelajaran mesin dan kaedah penyelesaian masalah yang mereka pakai, bukan kepada aplikasi berkaitan genetik. pembelajaran mesin. Pemilihan semula jadi ialah proses biologi yang diilhamkan oleh algoritma genetik. Untuk mencipta pelbagai pilih atur bagi penyelesaian yang berkemungkinan, algoritma ini menggunakan persamaan matematik mutasi, pemilihan dan silang.

Kongsi di facebook
Kongsi
Kongsi di linkedin
Kongsi
Kongsi di twitter
Tweet

Catatan Berkaitan

Pengarang

IMG
Hannah
a
Jin

Mengenai SCC

Kepentingan untuk berseronok dan maju dalam pendidikan teknologi untuk semua pelajar kami adalah moto kami. Kami mahu pelajar kami mencipta masa depan yang lebih baik bukan sahaja untuk diri mereka tetapi juga untuk masyarakat. Sama ada memprogramkan permainan video mereka sendiri, menganimasikan kartun mereka sendiri atau membina robot, tutor kami boleh membimbing mereka untuk mencari pandangan yang lebih baharu dan meneroka penemuan yang tidak ditemui melalui kursus kami.