도서출판 황소걸음 > 아카데미 > 빅데이터를 활용한 범죄 예측 - 머신러닝을 중심으로

빅데이터를 활용한 범죄 예측 - 머신러닝을 중심으로
빅데이터를 활용한 범죄 예측 - 머신러닝을 중심으로
글쓴이 : 황소걸음   날짜 : 18-02-01 15:25  
조회 : 781

제 목 : 빅데이터를 활용한 범죄 예측(Crime Prediction Using Big Data) 

-머신러닝을 중심으로

 

지은이 : 송주영, 송태민

쪽 수 : 414쪽

판 형 : 46배판 (188*257)

책 값 : 28,000원

펴낸날 : 2018년 1월 30일

펴낸곳 : 황소걸음 아카데미

ISBN : 979-11-86821-17-6 93310

 

 

2002년에 개봉한 영화 '마이너리티 리포트'가 현실로.

소셜 빅데이터를 학습한 머신러닝으로 미래의 범죄를 예측한다.

 

현대사회의 범죄 현상은 과거에 비해 보다 복잡하고 다양한 형태로 나타나고 있다. 따라서 범죄 현상을 예측하고 분석하는 방법도 다양하다. 첨단 정보통신기술이 경제·사회 전반에 융합되어 혁신적인 변화가 나타나는 4차 산업혁명 시대의 범죄 예측은 과거에 비해 복잡하고 다양한 방법을 요구하고 있다. 인공지능은 인간의 지능으로 할 수 있는 사고나 학습 등을 컴퓨터가 할 수 있도록 하는 방법을 연구하는 정보기술을 말하며 이는 머신러닝을 통해서 학습할 수 있다. 머신러닝은 과거의 데이터를 통해 학습한 후, 학습을 통하여 발견된 속성을 기반으로 새로운 데이터에 대해 예측을 하는 것이다.

 

표본에 근거한 제한된 결과만을 알 수 있던 과거와 달리 머신러닝은 모집단인 빅데이터를 학습하고 모형을 개발하여 예측하기 때문에 복잡하고 다양한 범죄 현상을 보다 정확하게 예측할 수 있다. 머신러닝이 학습할 수 있는 양질의 빅데이터를 생산하고 데이터에 적합한 머신러닝 알고리즘을 찾아 모델링하는 범죄학자(범죄 데이터 사이언티스트)로서의 역할은 매우 중요하다.

 

저자들은 그동안 범죄를 예측하여 선제적으로 대응하기 위해 정형화된 빅데이터와 소셜 빅데이터를 활용한 연구를 추진하였고, 이 책 역시 연구의 결과로, 실제로 빅데이터를 활용한 범죄 예측 모형을 개발하고 활용하기 위해 빅데이터의 수집부터 분석과 고찰에 이르는 전체 연구 과정을 자세히 담았다. 또한 온라인 문서에서 유용한 정보를 추출하는 텍스트 마이닝, 문서에 담긴 감정을 분석하는 오피니언 마이닝, 범죄 예측을 위한 머신러닝과 시각화 분석과정 등을 깊이 있게 다루었다.

 

 

[이 책의 특징]

 

첫째, 이 책에 수록된 대부분의 머신러닝 연구 사례는 청소년 비행(범죄) 등과 관련한 온라인 문서를 대상으로 분석하였다.

둘째, 이 책에 수록된 머신러닝 연구 사례의 모든 분석에는 기본적으로 오픈소스 프로그램인 R을 사용하였다.

셋째, 기본적인 통계 지식을 지닌 독자라면 누구나 쉽게 따라할 수 있도록 연구 단계별로 본문을 구성하고 상세히 기술하였다.

 

 

[주요 내용]

 

1부에서는 소셜 빅데이터의 이론적 배경과 함께 소셜 빅데이터를 분석하기 위한 다양한 연구방법론을 설명하였다. 1장에는 사이버 학교폭력의 위험을 예측하기 위해 소셜 빅데이터 분석 방법과 수집 및 분류 방법, 미래신호 예측 방법론 등에 대해 상세히 기술하였다. 2장에는 빅데이터 분석 프로그램인 R의 설치 및 활용 방법을 소개하고, 빅데이터 분석을 위해 데이터 사이언티스트가 습득해야 할 과학적 연구방법에 관해 기술하였다. 3장에는 머신러닝의 이론과 머신러닝 알고리즘인 나이브 베이즈 분류모형, 로지스틱 회귀모형, 랜덤포레스트 모형, 의사결정나무 모형, 신경망 모형, 서포트벡터머신 모형과 연관규칙, 군집분석, 모형 평가, 그리고 시각화 등을 적용하여 예측 모형을 개발하는 전 과정을 기술하였다.

 

2부에서는 국내의 온라인 뉴스 사이트, 블로그, 카페, 트위터, 게시판 등에서 소셜 빅데이터를 수집하고 분석한 연구 사례를 기술하였다. 4장에는 ‘머신러닝을 활용한 한국의 섹스팅 위험 예측’ 연구 사례를 기술하였다. 5장에는 ‘머신러닝을 활용한 한국 소년범의 범죄지속 위험 예측모형 개발’ 연구 사례를 기술하였다. 6장에는 ‘머신러닝 기반 의약품 부작용과 마약 위험 예측모형 개발’ 연구 사례를 기술하였다.

 

 

지은이

 

송주영

 

한양대학교 법학과를 졸업하고 동 대학원에서 형사법전공 석사학위를 받았다. 미시간 주립대학교 형사사법학대학에서 형사정책/형사사법 박사학위를 받았다. 웨스트조지아 주립대학교 범죄학과 조교수와 한국형사정책연구원 부연구위원으로 재직하였고, 현재 펜실베니아 주립대학교 범죄학과 조교수로 재직 중이다.

주요 저서로는 《머신러닝을 활용한 소셜 빅데이터 분석과 미래신호 예측》, 《R을 활용한 소셜 빅데이터 연구방법론》, 《빅데이터 연구 한 권으로 끝내기》,《빅데이터 분석방법론》이 있다. 주요 연구분야로는 청소년범죄 특히 학교폭력과 사이버폭력, 청소년성매매 등이고, Journal of Adolescent Health, Cyberpsychology Behavior and Social Networking, Journal of Criminal Justice, International Journal of Offender Therapy and Comparative Criminology, Computers in Human Behavior 등에 관련 논문을 게재하였다. jxs6190@psu.edu, juyoung81@gmail.com

 

송태민

 

동국대학교 전자계산학과를 졸업하고 동 대학원에서 전자정보처리전공 석사, 컴퓨터공학 박사학위를 받았다. 이화여자대학교, 연세대학교, 한양대학교 등에서 강의하였다. 한국보건사회연구원에서 통계정보연구실장, 건강증진개발센터소장, 사회정신건강연구센터장, 빅데이터연구센터장 등을 역임하고, 현재 삼육대학교 교수로 재직 중이다.

주요 저서로는 《머신러닝을 활용한 소셜 빅데이터 분석과 미래신호 예측》, 《R을 활용한 소셜 빅데이터 연구방법론》, 《빅데이터 연구 한 권으로 끝내기》, 《빅데이터 분석방법론》, 《보건복지연구를 위한 구조방정식 모형》이 있다. tmsong@syu.ac.kr, tmsong01@hanmail.net 

 


차례

 

1부 빅데이터 분석방법론

 

1장. 소셜 빅데이터 분석과 활용 방안

1. 서론

2. 소셜 빅데이터 분석방법

2.1 사이버 학교폭력 소셜 빅데이터 주제분석(text mining)

2.2 사이버 학교폭력 소셜 빅데이터 감성분석(opinion mining)

2.3 사이버 학교폭력 미래신호 예측방법론

3. 소셜 빅데이터 기반 사이버 학교폭력 미래신호 탐색 및 예측

3.1 사이버 학교폭력 미래신호 탐색

3.2 사이버 학교폭력 미래신호 예측

4. 결론 및 고찰

 

2장. 소셜 빅데이터 분석방법론

1. R의 설치와 활용

1.1 R 설치

1.2 R 활용

1) 패키지 설치 및 로딩

2) 값의 할당 및 연산

3) R의 기본 데이터형

4) R의 자료구조

5) R의 함수 사용

6) R 기본 프로그램(조건문과 반복문)

7) R 데이터 프레임의 변수 이용방법

8) R 데이터 프레임 작성

9) 변수 및 관찰치 선택

10) R의 주요 GUI(Graphic User Interface) 메뉴 활용

2. 과학적 연구설계

2.1 연구의 개념

2.2 변수 측정

1) 척도

2) 변수

2.3 분석단위

2.4 표본추출과 가설검정

1) 표본추출

2) 가설검정

2.5 통계분석

1) 기술통계분석

2) 추리통계분석

 

 

 

 

3장. 머신러닝

1. 서론

2. 머신러닝 학습데이터

3. 머신러닝 기반 사이버 학교폭력 예측모형 개발

3.1 나이브 베이즈 분류모형

3.2 로지스틱 회귀모형

3.3 랜덤포레스트 모형

3.4 의사결정나무 모형

3.5 신경망 모형

3.6 서포트벡터머신 모형

3.7 연관규칙

3.8 군집분석

4. 머신러닝 모형 평가

4.1 오분류표를 이용한 머신러닝 모형의 평가

1) 나이브 베이즈 분류모형 평가

2) 신경망 모형 평가

3) 로지스틱 회귀모형 평가

4) 서포트벡터머신 모형 평가

5) 랜덤포레스트 모형 평가

6) 의사결정나무 모형 평가

4.2 ROC 곡선을 이용한 머신러닝 모형의 평가

5. 시각화

5.1 텍스트 데이터의 시각화

5.2 시계열 데이터의 시각화

5.3 지리적 데이터의 시각화

 

2부 빅데이터 분석사례

 

4장. 머신러닝을 활용한 한국의 섹스팅(sexting) 위험 예측

1. 서론

2. 이론적 배경

3. 연구방법

3.1 연구대상

3.2 연구도구

3.3 분석방법

4. 연구결과

4.1 섹스팅 관련 문서(버즈) 현황

4.2 섹스팅 미래신호 탐색

4.3 섹스팅 관련 소셜 네트워크 분석

4.4 섹스팅의 위험에 미치는 요인

4.5 섹스팅 관련 위험 예측모형

5. 결론 및 고찰

 

 

 

5장. 머신러닝을 활용한 소년범의 범죄지속 위험 예측모형 개발

1. 서론

2. 이론적 논의

3. 연구대상 및 분석방법

3.1 연구대상 및 측정도구

3.2 통계분석

4. 연구결과

5. 결론 및 함의

 

6장. 머신러닝 기반 의약품 부작용과 마약 위험 예측모형 개발

1. 서론

2. 이론적 배경(약물감시체계 시스템)

2.1 자발적 보고 시스템(Spontaneous Reporting System)

2.2 전자보건의료데이터(Electronic Healthcare Data, EHD)를 이용한 시스템

2.3 소셜미디어를 활용한 약물감시

3. 연구방법

3.1 연구대상

3.2 연구도구

3.3 분석방법

4. 연구결과

4.1 의약품 부작용과 마약 온라인 문서 현황

4.2 마약 관련 미래신호 탐색

4.3 머신러닝 기반 의약품 부작용과 마약 위험 예측모형 개발

4.4 머신러닝 기반 예측모형 평가

4.5 연관분석

4.6 군집분석

4.7 시각화

5. 결론 및 고찰

 

찾아보기