Others

Penerapan Algoritma Levenberg-Marquadt dan Backpropagation Neural Network Untuk Klasifikasi Suara Manusia

Description
Voice recognition technology is currently experiencing growth, especially in the case of speech processing. Speech processing is a way to extract the desired information from a voice signal. This study discusses the classification of human voice
Categories
Published
of 10
2
Categories
Published
All materials on our website are shared by users. If you have any questions about copyright issues, please report us to resolve them. We are always happy to assist you.
Similar Documents
Share
Transcript
   David, Penerapan Algoritma Levenberg-Marquadt dan Backpropagation Neural Network Untuk Klasifikasi Suara Manusia 1   Penerapan Algoritma  Levenberg-Marquadt  dan  Backpropagation  Neural Network Untuk Klasifikasi Suara Manusia David Program Studi Teknik Informatika, STIMIK Pontianak Jln. Merdeka 372, Pontianak, Indonesia E-mail: David_Liauw@yahoo.com / DavidLiauw@gmail.com  Abstract . Voice recognition technology is currently experiencing growth, especially in the case of speech processing. Speech processing is a way to extract the desired information from a voice signal. This study discusses the classification of human voice system male and female. Extract the characteristics of the voice signal in each frame time domain and frequency domain is to help simplify and speed calculations. The features for voice or other audio between Short Time  Energy, Zero Crossing Rate, Spectral Centroid, and others. Test results show that the classification system the human voice using the backpropagation neural network and Levenberg-Marquadt algorithm to change matrix weight is very good because of the complexity and rapid calculation which is not too high. Database voice sample of 40 voices with the test data as much as 5 votes. The output of the system is the result of the classification that has been identified with a similarity value>=0.5 for male and <0.5 as a female. Testing using artificial neural network  produced an average success rate in voice classification amounted to 91%.    Keywords: Feature Extraction, Classification, Backpropagation, Levenberg- Marquadt Algorithm, Human Voice    Abstrak.  Teknologi pengenalan suara saat ini telah mengalami perkembangan terutama dalam hal speech processing. Speech processing merupakan suatu cara untuk mengekstrak informasi yang diinginkan dari sebuah sinyal suara. Penelitian ini membahas sistem klasifikasi suara manusia male dan female. Mengekstrak ciri dari sinyal suara setiap frame pada kawasan waktu dan kawasan frekuensi sangat membantu untuk menyederhanakan dan mempercepat perhitungan. Adapun fitur- fitur untuk suara atau audio antara lain Short Time Energy, Zero Crossing Rate, Spectral Centroid dan lain-lain. Hasil pengujian sistem menunjukkan bahwa klasifikasi suara manusia dengan menggunakan jaringan saraf tiruan backpropagation dan algoritma Levenberg-Marquadt untuk perubahan matriks bobot, sangat baik dan cepat karena kompleksitas perhitungan yang tidak terlalu tinggi. Database sample suara sebanyak 40 buah dengan data test sebanyak 5 suara. Output dari sistem adalah hasil klasifikasi yang telah dikenali dengan nilai kemiripan >= 0,5 sebagai pria dan < 0,5 sebagai wanita. Pengujian dengan menggunakan jaringan saraf tiruan dihasilkan rata-rata tingkat keberhasilan dalam klasifikasi suara adalah sebesar 91 %.  Kata Kunci: Feature Extraction, Klasifikasi, Backpropagation, Algoritma  Levenberg-Marquadt, Suara Manusia 1. Pendahuluan Saat ini perkembangan teknologi pengenalan suara sudah mengalami kemajuan yang cukup pesat. Seiring dengan perkembangan metode-metode pemrosesan dari pengenalan suara telah banyak aplikasi-aplikasi yang telah dihasilkan. Dari perkembangan teknologi pengolahan sinyal suara ini didapatkan ide untuk membuat aplikasi yang dapat digunakan untuk membedakan atau mengklasifikasikan suara manusia. Klasifikasi merupakan salah satu dari aplikasi proses digital   signal processing (pengolahan sinyal digital) termasuk didalamnya speech recognition . Dalam penelitian ini, dirancang sebuah program yang dapat  2  Jurnal Buana Informatika,  Volume 4, Nomor 1, Januari 2013: 1-10   mengklasifikasikan sejumlah sample  suara dengan fitur-fitur suara yang direpresentasikan secara numerik. Implementasi sistem klasifikasi suara manusia ini menggunakan MATLAB. Pada MATLAB tersedia toolbox  yang berguna untuk membuat aplikasi klasifikasi suara manusia, yaitu audio signal processing dan  neural net. Data training  diperoleh dari  file-file  suara statis berformat wave . Data training  tersebut akan diekstrak cirinya untuk didapatkan  feature -nya. Feature  inilah yang akan digunakan untuk klasifikasi suara manusia berdasarkan gender pria ( male ) dan wanita (  female ). Untuk men- training  data suara hasil ekstraksi  feature  digunakan jaringan syaraf tiruan backpropagation . Adapun perubahan bobotnya menggunakan algoritma  Levenberg-Marquadt.  Secara keseluruhan tujuan dari penelitian ini adalah untuk membangun sebuah program yang dapat mengklasifikasikan sejumlah  file  suara manusia yang berformat wave  dengan menggunakan jaringan syaraf tiruan  Backpropagation  dan algoritma  Levenberg-Marquadt.  Penulis merumuskan masalah sebagai berikut 1) bagaimana mengimplementasikan klasifikasi suara; 2) apa saja fitur suara yang akan diekstrak; 3) bagaimana fitur tersebut diekstrak dan 4) teknik klasifikasi apa yang digunakan. 2. Tinjauan Pustaka 2.1.  Speech Processing Suara adalah suatu sinyal yang sangat dipengaruhi oleh frekuensi dan merupakan bentuk sinyal diskret yang sangat dipengaruhi oleh waktu (Deller, et.al., 1993). Speech  processing  mengekstrak informasi yang diinginkan dari sebuah sinyal suara. Untuk memproses sebuah sinyal dengan sebuah komputer digital, sinyal harus dihadirkan dalam bentuk digital sehingga sinyal tersebut dapat digunakan oleh sebuah komputer digital. Awalnya, gelombang suara akustik diubah ke sebuah sinyal digital sesuai untuk voice processing  (Sandberg, 2001). Sebuah microphone  atau telephone handset   dapat digunakan untuk merubah gelombang akustik ke dalam sebuah sinyal analog. Sinyal analog ini dikondisikan dengan antialiasing filtering . Sinyal analog terkondisikan kemudian diubah ke dalam bentuk sebuah sinyal digital oleh sebuah analog-to-digital (A/D) converter  . 2.2.  FFT (Fast Fourier Transform) Transformasi Fourier adalah suatu metode yang sangat efisien untuk menyelesaikan Transformasi Fourier Diskret yang banyak dipakai untuk keperluan analisa sinyal seperti pemfilteran, analisa korelasi, dan analisa spectrum.  Diskret Fourier Transformasi (DFT)  adalah deretan yang terdefinisi pada kawasan frekuensi diskret yang merepresentasikan Transformasi Fourier terhadap suatu deretan terhingga (  finite duration sequence ).  DFT berperan penting untuk implementasi algoritma suatu varitas pengolahan sinyal, karena efisien untuk komputasi berbagai aplikasi. Fast Fourier Transformation  atau transformasi Fourier cepat, merupakan proses lanjutan dari  DFT (Discrete Fourier Transformation) . Transformasi Fourier ini dilakukan untuk mentransformaikan sinyal dari domain waktu ke domain frekuensi. Hal ini bertujuan agar sinyal dapat diproses dalam spectral  substraksi. FFT   adalah bentuk khusus dari persamaan integral Fourier (Sandberg, 2001).    10 / 2 1,...,2,1,0,  N n N kn jnk   N k e x X      (1) Dalam proses  fast fourier transform  akan menghasilkan dua buah nilai yaitu nilai real dan nilai imajiner. Dan untuk proses selanjutnya dibutuhkan nilai real saja untuk itu diperlukan proses mutlak log. 2.3.  Feature Extraction   Mengekstrak ciri dari sinyal suara setiap  frame  pada time domain  dan  frequency domain     David, Penerapan Algoritma Levenberg-Marquadt dan Backpropagation Neural Network Untuk Klasifikasi Suara Manusia 3   sangat membantu untuk menyederhanakan dan mempercepat perhitungan serta mempermudah interpretasi secara fisik. Ciri-ciri ini termasuk level standar deviasi dan rata-rata standar deviasi. Adapun fitur-fitur untuk suara atau audio, antara lain Short Time Energy, Zero Crossing Rate, Spectral Centroid, Spectral Flux, Bandwith, Cepstral Coefficient, Delta Spectrum, Root Mean Square, High Feature Value Ratio, Low Feature Value Ratio, Spectral Spread, Spectral RollOff   dan lain-lain (Giannakopoulos, 2006). 2.3.1. Spectral Centroid    Menyeimbangkan titik ukuran spectrum  dari bentuk asosiasi spectral  dengan spectral brighness . Nilai centroid   yang tinggi menunjukkan frekuensi yang tinggi (Giannakopoulos, 2006).     N nt  N nt  n M nn M C  11 ][].[  (2) 2.3.2.  Zero Crossing Rate    Zero crossing  merupakan sample  berurutan pada sebuah sinyal digital yang memiliki perbedaan tanda, ukuran dari noise  sebuah sinyal pada fitur time domain (Giannakopoulos, 2006).     N n n xsignn xsign  N  ZCR 2 ))1(())(( 1  (3) dimana:  0,10,00,1)(  x x x xsign  (4) 2.3.3. Short Time energy Amplitudo dari sinyal suara berbeda terhadap waktu. Secara umum, amplitude  dari segmen unvoiced speech  ini jauh lebih rendah daripada amplitude  dari voiced segments . Short Time Energy  dapat didefinisikan dengan persamaan 5 (Giannakopoulos, 2006).     N n n x N STE  12 )(1  (5) 2.4.  Backpropagation Neural Network  Backpropagation  merupakan salah satu algoritma yang sering digunakan dalam menyelesaikan masalah-masalah yang rumit (Fausett, 1993). Hal ini dimungkinkan karena  jaringan dengan algoritma ini dilatih dengan menggunakan metode belajar terbimbing. Pada  jaringan diberikan sepasang pola yang terdiri atas pola masukan dan pola yang dinginkan. Ketika suatu pola diberikan pada jaringan, bobot-bobot diubah untuk memperkecil perbedaan pola. Algoritma pelatihan jaringan syaraf backpropagation  terdiri atas dua langkah, yaitu  4  Jurnal Buana Informatika,  Volume 4, Nomor 1, Januari 2013: 1-10   perambatan maju dan perambatan mundur ini dilakukan pada jaringan untuk setiap pola yang diberikan selama jaringan mengalami pelatihan. Jaringan backpropagation  terdiri atas tiga lapisan atau lebih unit pengolahan, bagian kiri sebagai masukan, bagian tengah disebut sebagai lapisan tersembunyi dan bagian kanan disebut lapisan keluaran. Ketiga lapisan ini terhubung secara penuh. Perambatan maju dimulai dengan memberikan pola masukan ke lapisan masukan. Pola masukan ini merupakan nilai aktivsi unit-unit masukan. Dengan melakukan perambatan maju dihitung nilai aktivsi pada unit-unit di lapisan berikutnya. Pada setiap lapisan, tiap unit pengolah melakukan penjumlahan berbobot dan menerapkan fungsi sigmoid untuk menghitung keluarannya. Untuk menghitung nilai penjumlahan berbobot digunakan Persamaan 6 (Hermawan, 2006).    ni jii j  waS  0 .  (6) dengan : a i  = masukan yang berasal unit i w  ji   = bobot sambungan dari unit i ke unit j Setelah nilai S   j  dihitung, fungsi sigmoid diterapkan pada S   j  untuk membentuk  f(S   j ) . Fungsi sigmoid ini mempunyai Persamaan 7 (Siang, 2005).   Sj j eS  f    11  (7) Hasil perhitungan  f(S   j )  ini merupakan nilai aktivasi pada unit pengolah  j.  Nilai ini dikirimkan keseluruh keluaran unit j. Setelah perambatan maju dikerjakan maka jaringan siap melakukan perambatan mundur. Jaringan perambatan mundur dilatih dengan metode belajar terbimbing. Pada metode ini jaringan diberi sekumpulan pasangan pola yang terdiri dari pola masukan dan pola yang diinginkan ( target  ). Pelatihan dilakukan berulang-ulang sehingga dihasilkan jaringan yang memberikan tanggapan yang benar terhadap semua masukannya. Pembelajaran atau learning process  merupakan sarana pelatihan untuk mendapatkan nilai bobot yang sesuai pada setiap node  yang membentuk jaringan syaraf tiruan (ANN). Data akan dibagi menjadi 2 bagian yang pertama untuk digunakan sebagai proses pembelajaran yang disebut dengan data training  dan yang bagian kedua untuk proses pengujian yang disebut data testing . Untuk kasus di atas pola pembelajaran dan pengujiannya dapat diuraikan sbb: a) Memasukan sejumlah data berupa nilai angka pada node   input   dan output  ; b) Menggunakan algoritma pembelajaran backpropagation  dan algoritma  Levenberg-Marquad   untuk melakukan update  nilai bobot pada node  di lapisan hidden -nya (Berghen, 2004); c) Bila proses belajar sudah mencapai konvergen, nilai bobot tersebut akan disimpan dan untuk diujikan kembali untuk data yang sama; dan d) Melakukan pengujian dengan menggunakan data yang berlainan dengan proses pembelajaran. 2.5. Algoritma  Levenberg-Marquadt   Metode ini merupakan kombinasi algoritma Newton dengan metode Steepest descent (gradient descent) . Apabila metode gradient descent   dinyatakan sebagai Persamaan 8 (Purnomo dan Kurniawan, 2006): (8)     David, Penerapan Algoritma Levenberg-Marquadt dan Backpropagation Neural Network Untuk Klasifikasi Suara Manusia 5   G dan disederhanakan menjadi wk+1=Wk- αg  G adalah vector gradient  . Bentuk persamaan Newtonnya adalah: (9) A k   adalah matrik Hessian (elemennya adalah turunan kedua galat terhadap penimbang) (Purnomo dan Kurniawan, 2006): (10) Algoritma  Levenberg-Marquadt   menggunakan matrix  Jacobi. Dimisalkan  f  i  ditandai dengan  J  i (x)  maka metode  Levenberg-Marquadt akan mencari langkah yang tepat untuk memberikan solusi  p  dari persamaan ( equation ).   k T k k k k  T k   f  J  p I  J  J       (11) Di mana nilai scalar   k   bukan negatif dan  I merupakan matriks identitas. Matrik A dapat dituliskan menjadi A=2J T J, J adalah matrik Jacobian. Persamaan perbaikan penimbang metode  Levenberg Marquardt (LM)  untuk Jaringan syaraf tiruan backpropagation  adalah sebagai berikut (Purnomo dan Kurniawan, 2006) : (12) e : vector   galat kumulatif pada keluaran untuk semua pola I : matrik identitas J : matrik Jacobian (MxP) galat keluaran terhadap N penimbang JST µ : laju pelatihan 3. Metode Penelitian Dalam penelitian ini, terlebih dahulu digunakan studi pustaka terhadap berbagai referensi yang berkaitan dengan topik penelitian ini untuk memperoleh informasi perkembangan terkini. Berdasarkan informasi ini maka dilakukan perancangan sistem dan selanjutnya dilakukan metode penelitian riset eksperimental, yang meliputi kegiatan, sebagai berikut 1) Studi literatur. Pada tahap ini dilakukan pengumpulan dan pembelajaran bahan-bahan untuk pengerjaan aplikasi yang berupa buku-buku referensi, informasi dari internet ataupun dari sumber lain; 2) Studi penggunaan perangkat lunak. Pada tahap ini dipelajari perangkat lunak yang digunakan yaitu MATLAB; dan 3) Perancangan dan implementasi aplikasi. Pada tahap ini, dirancang aplikasi klasifikasi suara manusia dan diimplementasikan menggunakan MATLAB. Adapun data penelitian yang digunakan adalah data sample  suara mahasiswa Magister Ilmu Komputer FMIPA UGM Yogyakarta yang mengambil mata kuliah Pengenalan Pola pada tahun 2008 sejumlah 10 orang mahasiswa dengan masing-masing 5 sample  suara. 4. Pembahasan Sistem kerja perangkat lunak pengklasifikasian suara manusia ditunjukkan pada Gambar 2.
Search
Similar documents
View more...
Tags
Related Search
We Need Your Support
Thank you for visiting our website and your interest in our free products and services. We are nonprofit website to share and download documents. To the running of this website, we need your help to support us.

Thanks to everyone for your continued support.

No, Thanks
SAVE OUR EARTH

We need your sign to support Project to invent "SMART AND CONTROLLABLE REFLECTIVE BALLOONS" to cover the Sun and Save Our Earth.

More details...

Sign Now!

We are very appreciated for your Prompt Action!

x