Mencari Nilai k untuk Algoritma K-Means
Dalam konteks machine learning, mencari nilai \( k \) sering kali merujuk pada proses memilih nilai yang tepat atau paling optimal untuk parameter \( k \). dalam algoritma K-Means mencari nilai k merupakan tantangan , kaerna nilai tersebut harus diketahui di awal, kalau tidak maka proses perhitungan tidak dapat dilakukan.
Berikut ini adalah contoh implementasi mencari nilai k pada pemrograman Python:
from sklearn.cluster import Kmeans
from sklearn import metrics
from scipy.spatial.distance import cdist
import numpy as np
import matplotlib.pyplot as plt
x = np.array([3, 1, 1, 2, 1, 6, 6, 6, 5, 6, 7, 8, 9, 8, 9, 9, 8])
y = np.array([5, 4, 5, 6, 5, 8, 6, 7, 6, 7, 1, 2, 1, 2, 3, 2, 3])
plt.plot()
plt.xlim([0, 10])
plt.ylim([0, 10])
plt.title('K-Means Data set')
plt.scatter(x,y)
plt.show()
Output dari program Python tersebut adalah: