clustering
OR
학부 정리
- k-means
- k-medoids
- PAM
- CLARA
- CLARANS
- AGNES
- DIANA
- DBSCAN
- OPTICS
- GRID
- 주제를 정하고 한게 아니고, 데이터 안에서 통찰을 찾은건데, 막상 우리 분석이 정말 의미가 있는지 모르겠다.
- 안정형, 탐색형을 분류하는게 무슨 의미가 있고, 이걸 18~19세 데이터만 측정하는게 대체 무슨 의미가 있을까
- 오늘 발표한거 보니까 변수 해석보다는 분석 방법론(어떻게 분석을 진행했고, 예측률이 얼마나 나오는지)에 더 집중해서 진행한거 같은데, 원래 회귀분석에서는 분석 방법론에 더 집중하는게 맞는가?
- 다중 공산성 문제가 있는데 트리기반 모델을 사용했고, l1, l2 엘라스틱넷을 사용했는데, 이게 다중 공산성 문제를 완전히 해결했다고 할 수 있을까
- logistic regression의 결과 중 p value가 낮은 변수로 다시 분석을 진행해보면 괜찮을까
- train, test set을 분리하는 과정에서 가중치가 왜곡될 수 있어보인다.
- 분석 모델을 너무 적게 사용했다고 생각할 수 있을까?