지은이 : 강봉주
1984년 서울대학교 계산통계학과에 입학하여 학사를 취득하고 동 대학원 통계학과에서 석사 및 박사 학위를 취득하였다. 1993년에 국내 SAS에서 첫 직장 생활을 하였으며 이때부터 데이터 분석 관련 컨설팅 작업을 수행하였다. 1995년에 유니컨설팅 회사를 창립해, 주로 제조 분야에서 데이터 분석 컨설팅 및 관련 통계 패키지를 개발하였다. 1997년에는 유니보스를 창립해 금융 분야 데이터 분석 컨설팅 및 CRM 관련 패키지를 개발하였으며, 2004년에 ㈜배닌을 창립해 SAS, 오픈소스 기반의 머신러닝 및 딥러닝 프로젝트를 수행하고 있다. 주요 저서로는 <파이썬으로 실무에 바로 적용하는 머신러닝>,
1장 SAS Viya Workbench 시작하기
1.1 개요
1.2 SAS Viya Workbench 환경 구성
1.3 개발 환경
1.3.1 탐색기
1.3.2 검색 메뉴
1.3.3 소스 관리 메뉴
1.3.4 실행 및 디버그 메뉴
1.3.5 확장 앱 메뉴
1.3.6 SAS 앱
1.4 개발환경 테스트
1.5 Autoexec.sas
2장 SAS 프로시저 기반의 머신러닝
2.1 개요
2.2 프로세스
2.3 모델 평가
2.3.1 일반화 모델 성능 예시
2.3.2 편향-분산 균형
2.4 머신러닝 구조
2.4.1 기울기 하강법 예시
2.5 사용 데이터
2.5.1 주택담보대출 데이터
2.5.1.1 데이터 구성
2.5.2 캘리포니아 주택가격 데이터
2.5.2.1 데이터 구성
2.6 데이터 분할
2.7 데이터 전처리
2.7.1 전처리 예시
2.7.2 데이터 탐색
2.7.2.1 결측값
2.7.2.2 카디널리티
2.7.2.3 엔트로피
2.7.2.4 정성 변동 지수
2.7.2.5 변동 계수
2.7.2.6 비대칭도
2.7.2.7 첨도
2.7.2.8 이상값
2.7.2.9 연속형 변수 데이터 탐색 요약
2.7.3 데이터 변환
2.7.3.1 결측값 처리
2.7.3.1.1 행 결측
2.7.3.1.2 열 결측
2.7.3.1.3 결측값 대체
2.7.3.2 숫자형 데이터 변환
2.7.3.2.1 구간화
2.7.3.2.1.1 등간격 구간화
2.7.3.2.1.2 등빈도 구간화
2.7.3.2.2 정규 변환
2.7.3.2.2.1 로그 변환
2.7.3.2.2.2 표준 변환
2.7.3.3 범주형 데이터 변환
2.7.3.3.1 희귀 범주 변환
2.7.3.3.2 수준 변환
2.7.3.3.3 범주 빈도 변환
2.7.3.3.4 범주 빈도 비율 변환
2.7.3.3.5 원핫 인코딩 .
2.7.3.3.6 목표변수 평균값 변환
2.7.3.3.7 증거 가중값 변환
2.7.3.4 데이터 변환 적용 방법
2.7.4 변수 선별
2.7.4.1 상수값
2.7.4.2
2.7.4.3 누수율
2.7.4.4 변동계수
2.7.4.5 상호정보
2.7.4.6 결측률
2.7.4.7 중복 변수
2.7.5 변수 선택
2.7.5.1 지도 학습 변수 선택
2.7.5.1.1 회귀 문제
2.7.5.1.1.1 HOUSING 데이터 예
2.7.5.1.2 분류 문제
2.7.5.1.2.1 HMEQ 데이터 예
2.7.5.2 비지도 학습 변수 선택
2.8 모델 구성
2.8.1 모델 생성
2.8.1.1 지도 학습 모델
2.8.1.1.1 결정나무 모델
2.8.1.1.1.1 나무 성장
2.8.1.1.1.2 가지 치기
2.8.1.1.1.3 모델 적합도
2.8.1.1.1.4 변수 중요도
2.8.1.1.1.5 모델 저장 및 스코어링
2.8.1.1.1.5.1 코드 파일 형식
2.8.1.1.1.5.2 이진 파일 형식
2.8.1.1.1.6 모델 평가
2.8.1.1.1.6.1 기준 통계량
2.8.1.1.1.6.2 모델 평가
2.8.1.1.1.2.1 최적 절사값
2.8.1.1.1.7 필수 문장
2.8.1.1.2 랜덤 포레스트 모델
2.8.1.1.2.1 배깅
2.8.1.1.2.2 알고리즘
2.8.1.1.2.3 적용 예시
2.8.1.1.2.3.1 모델 적합
2.8.1.1.2.3.2 스코어링
2.8.1.1.2.3.2 모델 평가
2.8.1.1.2.2.3.1 최적 절사값
2.8.1.1.2.4 결측값 처리
2.8.1.1.2.5 필수 문장
2.8.1.1.3 그래디언트 부스팅 모델
2.8.1.1.3.1 성능 기준
2.8.1.1.3.2 조기중단
2.8.1.1.3.3 초모수
2.8.1.1.3.4 적용 예시
2.8.1.1.3.4.1 모델 적합
2.8.1.1.3.4.2 모델 안정성
2.8.1.1.3.4.3 스코어링
2.8.1.1.3.4.4 모델 평가
2.8.1.1.3.5 필수 문장
2.8.1.1.4 경량 그래디언트 부스팅 모델
2.8.1.1.4.1 초모수
2.8.1.1.4.2 적용 예시
2.8.1.1.4.2.1 모델 적합
2.8.1.1.4.2.2 모델 안정성 평가
2.8.1.1.4.2.3 스코어링
2.8.1.1.4.2.4 모델 평가
2.8.1.1.4.3 필수 문장
2.8.1.1.5 지지벡터 머신
2.8.1.1.5.1 수학적 이해
2.8.1.1.5.2 소프트 마진
2.8.1.1.5.3 커널 트릭
2.8.1.1.5.4 지지벡터
2.8.1.1.5.5 결정 경계선
2.8.1.1.5.6 초모수
2.8.1.1.5.7 적용 예시
2.8.1.1.5.7.1 모델 적합
2.8.1.1.5.7.2 커널
2.8.1.1.5.7.3 모델 안정성
2.8.1.1.5.7.4 스코어링
2.8.1.1.5.7.5 모델 평가
2.8.1.1.5.8 필수 문장
2.8.1.1.6 베이즈 망
2.8.1.1.6.1 변수 간 의존성
2.8.1.1.6.2 변수 선택
2.8.1.1.6.3 망 구조 학습
2.8.1.1.6.4 모수 학습
2.8.1.1.6.5 초모수
2.8.1.1.6.6 적용 예시
2.8.1.1.6.6.1 모델 적합
2.8.1.1.6.6.2 베이즈 망 구조
2.8.1.1.6.6.3 스코어링
2.8.1.1.6.6.4 모델 평가
2.8.1.1.6.7 필수 문장
2.8.1.1.7 로지스틱 회귀
2.8.1.1.7.1 모수 추정
2.8.1.1.7.2 목표변수 분포
2.8.1.1.7.3 연결함수
2.8.1.1.7.4 목표변수 분포와 연결함수 관계
2.8.1.1.7.5 변수 선택
2.8.1.1.7.6 초모수
2.8.1.1.7.7 적용 예시
2.8.1.1.7.7.1 결측값 대체
2.8.1.1.7.7.2 모델 적합
2.8.1.1.7.7.3 스코어링
2.8.1.1.7.7.4 모델 평가
2.8.1.1.7.8 필수 문장
2.8.1.1.8 다층 신경망
2.8.1.1.8.1 활성함수
2.8.1.1.8.2 모수 추정
2.8.1.1.8.3 훈련 모수
2.8.1.1.8.4 초모수
2.8.1.1.8.5 적용 예시
2.8.1.1.8.5.1 모델 적합
2.8.1.1.8.5.2 모델 안정성
2.8.1.1.8.5.3 스코어링
2.8.1.1.8.5.4 모델 평가
2.8.1.1.8.6 필수 문장
2.8.1.1.9 K 최근접 이웃
2.8.1.1.9.1 이웃
2.8.1.1.9.2 초모수
2.8.1.1.9.3 적용 예시
2.8.1.1.9.3.1 결측값 대체
2.8.1.1.9.3.2 원핫 인코딩
2.8.1.1.9.3.3 ID 변수 지정
2.8.1.1.9.3.4 ID 모델 적합
2.8.1.1.9.3.5 스코어링
2.8.1.1.9.3.6 모델 평가
2.8.1.1.9.4 필수 문장
2.9 설명 가능 머신러닝
2.9.1 SHAP 모델
2.9.1.1 모델 생성 필수 조건
2.9.1.2 샤플리 값
2.9.1.2.1 HyperSHAP
2.9.1.2.2 커널 SHAP
2.9.1.3 초모수
2.9.1.4 적용 예시
2.9.1.4.1 질의 데이터
2.9.1.4.2 샤플리 값
2.9.1.5 필수 문장
도서 DB 제공 - 알라딘 인터넷서점 (www.aladin.co.kr)