Selasa, 12 April 2022

Keputusan ”Play Tennis”

  1. Perhatikan data yang ada pada tabel keputusan "Play Tennis".
  2. Buatlah pohon keputusan untuk data tersebut.

JAWAB:
Menentukan information gain untuk atribut outlokk sebagai root. Dimana dari keseluruhan data terdata 9 instans untuk play = yes, dan instans untuk play = no. Selanjutnya info semesta sebagai (log basis 2).

Menghitung entropy pada masing-masing nilai atribut outlook.
Outlook = sunny

Ada 2 play = yes dan play = no, menghitung infonya.

Outlook = cloudy
Ada 4 play = yes dan tidak ada instans untuk play = no, menghitung infonya.
Info([4,0]) = entropy(4/4,0/4)
                  = -4/4log(4/4) - 0/4log(0/4)
                  = 0

Outlook = rainy
Ada 3 play = yes dan ada 2 play = no, menghitung infonya.

Selanjutnya menghitung information gain untuk atribut outlook sebagai:

Pohon Keputusan


Jumat, 08 April 2022

Koefisien Jaccard

 1.      Jika diketahui A={1,2,3,4}, B={1,2,4}, dan C={1,2,4,5}, berapakah Jaccard (A,B), Jaccard(B,C), dan Jaccard(A,C)?

Jawab:


2. 

1.      Dik : Query : ideas of march

         Doc1 : caesar died in march

         Doc2 : the long march

Dit : koefisien jaccard antara Query dengan Doc1 dan Doc2

Q n Doc1 = {march} = |Q  Doc1| = 1

Q u Doc1 = {ideas, of, march, caesar, died, in} = |Q  Doc1| = 6

Q n Doc2 = {march} = |Q  Doc2| = 1

Q u Doc2 = {ideas, of, march, the, long} = |Q  Doc2| = 5

3.

1.      Jaccard(D1,D2)

D1 = 4 (Jack London, London traveled, traveled to, to Oakland)

D2 = 7 (Jack London, London traveled, traveled to, to the, the city, city of, of Oakland)

|D1 n D2| = 3

|D1 u D2| = 8

Jaccard(D1,D3)

D1 = 4 (Jack London, London traveled, traveled to, to Oakland)

D2 = 5 (Jack Traveled, traveled from, from Oakland, Oakland to, to London)

|D1 n D3| = 0

|D1u D2| = 9