2013-03-18

Histogram Of Oriented Gradients



Histogram Of Oriented Gradients ini digunakan untuk mengekstraksi fitur pada obyek gambar dengan menggunakan obyek manusia. Berdasarkan langkahnya, proses awal pada metode HOG adalah mengkonversi citra RGB (Red, Green, Blue) menjadi grayscale, yang kemudian dilanjutkan dengan menghitung nilai gradien setiap piksel. Setelah mendapatkan nilai gradien, maka proses selanjutnya yaitu menentukan jumlah bin orientasi yang akan digunakan dalam pembuatan histogram. Proses ini disebut spatial orientation binning. Namun sebelumnya pada proses gradient compute gambar pelatihan dibagi  menjadi beberapa cell dan dikelompokkan menjadi ukuran lebih besar yang dinamakan block. Sedangkan pada proses normalisasi block digunakan perhitungan geometri R-HOG. Proses ini dilakukan karena terdapat block yang saling tumpang tindih. Berbeda dengan proses pembuatan histogram citra yang menggunakan nilai – nilai intensitas piksel dari suatu citra atau bagian tertentu dari citra untuk pembuatan histogramnya. 

8.5.1 Konversi Citra
Citra true colour adalah representasi citra berwarna yang mrmiliki tiga komponen utama yaitu merah, hijau dan biru (RGB). Masing-masing komponen pada citra true colour mempunyai 256 kemungkinan nilai. Citra grayscale memiliki 28 (256) kemungkinan nilai pada pikselnya. Nilai tersebut dimulai dari nol untuk warna hitam dan 255 untuk warna putih [7]. Konversi Citra true colour ke Grayscale mengubah nilai piksel yang semula mempunyai 3 nilai yaitu Red, Green, Blue  menjadi satu nilai yaitu keabuan. Berikut persamaan yang digunakan untuk mendapatkan nilai keabuan :

L  = 0.144*R+0.587*G+0.299*B                                            (2)(3.1)

Dimana :
L                : nilai keabuan pada piksel
0.144         : bobot untuk elemen warna merah (wR)
0.587         : bobot untuk elemen warna biru (wB)
0.299            : bobot untuk elemen warna hijau (wG)
R                : nilai intensitas elemen warna merah
B                : nilai intensitas elemen warna biru
G               : nilai intensitas elemen warna hijau
NTSC (National Television System Committee) mendefinisan bobot untuk konversi citra true colour ke grayscale sebagai berikut : wR = 0.299, wB = 0.587, wG = 0.114.
Data masukkan berupa citra true colour dan data keluaran berupa citra Grayscale. 

                   
8.5.2 Gradient Compute
Setelah proses konversi citra yaitu mengubah gambar dalam bentuk grayscale langkah selanjutnya adalah menghitung nilai gradien setiap piksel dalam gambar.

 
8.5.3   Spatial Orientation Binning
Untuk membuat sebuah histogram dibutuhkan nilai gradien dan nilai tersebut didapat dari nilai tiap piksel dalam sebuah gambar. Gambar kemudian akan dibagi menjadi cells dengan ukuran yang telah ditentukan. Jadi tiap cells dalam gambar akan dibuat histogramnya untuk mengetahui nilai dalam tiap cells karena tiap cell mempunyai nilai yang berbeda.

Dalam pembuatan histogramnya diperlukan adanya bin untuk mengetahui nilai gradiennya. Bin akan ditentukan sendiri oleh pengguna. Dalam penelitian sebelumnya bin yang digunakan adalah 4 bin orientation [4].

8.5.4  Normalization Block
Karena nilai gradien mempunyai nilai yang berbeda oleh karena itu diperlukan pengelompokkan cells menjadi lebih besar atau yang disebut dengan block. Block biasanya tumpang tindih karena setiap cells kontribusi nilai lebih dari sekali. 
Dalam normalisasi block ini terdapat dua geometri block utama yaitu block  persegi panjang R-HOG dan melingkar C-HOG akan tetapi dalam penelitian ini yang akan digunakan adalah geometri R-HOG.
Hasil akhir dalam normalisasi block ini yaitu fitur. Dalam proses ini, block yang tumpang tindih diselesaikan dengan R-HOG. Sedangkan dalam block terdiri dari 2 x 2 cells, dalam detector windows terdapat 7 x 15 R-HOG dan menggunakan 4 bin orientasi sehingga diperoleh 1680 vektor dalam 1 detector windows. Jumlah vektor ini di dapat dari 2x2x7x15x4 dan vektor ini yang disebut sebagai fitur. Gambar 2.7 adalah contoh bentuk geometri R-HOG.

8. 5.5   Detector Windows
Detector windows merupakan windows atau jendela berukuran 64 x 128 yang digunakan untuk jendela pendeteksian. Jendela pendeteksian ini terdiri dari 8 x 8 piksel dalam tiap cells.

2 comments:

  1. Terima kasih mbak postingan mbak mengenai Histogram of Oriented Gradient sangat membantu saya

    ReplyDelete