범죄 예측에서 랜덤 포레스트 평가
: 3계층 랜덤 포레스트와 로지스틱 회귀 비교
범죄 예측에서 랜덤 포레스트 평가
: 3계층 랜덤 포레스트와 로지스틱 회귀 비교
8. 범죄 예측에서 랜덤 포레스트 평가 : 3계층 랜덤 포레스트와 로지스틱 회귀 비교
형사사법 분야에서는 재범·범죄 관여 위험을 정확히 예측해 감독과 처우를 최적화하는 것이 중요하지만, 기존 통계기법은 성능에 한계가 있습니다. 머신러닝이 잠재적 우위를 보이지만 전통적 회귀모형보다 일관된 우월성을 입증하지 못하기 때문에 추가 검증이 필요하며, 특히 희귀 사건인 청소년 범죄 예측에서 이러한 한계가 두드러집니다.
이에 본 연구는 청소년·청년의 범죄 관여를 예측할 때 머신러닝(특히 랜덤 포레스트)이 전통적 로지스틱 회귀보다 더 정확하고 안정적인지 검증하는 것을 목표로 합니다. Add Health 종단자료를 이용해 체포·유죄판결·구금 여부를 예측하고, 사회인구학적·행동상황적·정서환경적 요인을 단계적으로 투입하여 두 모델의 성능을 비교했습니다. 특히 false negative 감소를 위해 10:1 비용비율을 적용한 balanced 랜덤 포레스트의 효과를 함께 평가했습니다.