데이터 7

자바스크립트의 기초

자바스크립트(JAVASCRIPT)란? 자바스크립트는 객체 기반의 스크립트 프로그래밍 언어이다. 즉, 웹 문서를 동적으로 제어하기 위해 고안된 프로그래밍 언어이다. 이 언어는 웹브라우저 내에서 주로 사용하며, 다른 응용 프로그램의 내장 객체에도 접근할 수 있는 기능을 가지고 있다. HTML : 모델 담당 CSS : 뷰 담당 자바스크립트 : 제어담당 자바스크립트의 역할 요소의 추가 및 삭제 CSS 및 HTML 요소의 스타일 변경 사용자와의 상호작용 폼의 유효성 검증 마우스와 키보드 이벤트에 대한 스크립트 실행 웹 브라우저 제어 및 쿠키 등의 설정과 조회 AJAX 기술을 이용한 웹 서버와의 통신 자바스크립트의 역할 대소문자 구분하여 작성 문장은 세미콜론(;)으로 구분 큰따옴표(" ")와 작은 따옴표(' ')를..

추천 시스템 (Recommendation System)

추천시스템이란 추천 시스템은 정보 필터링 (IF) 기술의 일종으로, 특정 사용자가 관심을 가질만한 정보 (영화, 음악, 책, 뉴스, 이미지, 웹 페이지 등)를 추천하는 것이다. 추천 시스템에는 협업 필터링 기법을 주로 사용한다. 소셜 북마크 사이트에서 링크를 사람들에게 추천하고 무비렌즈 데이터 세트에서 영화를 추천하는 방법등이 이에 속한다. 재화와 서비스가 있는 모든 분야에 추천 ex) 옷 가게에서 뭐가 잘 나가나요? 저한테 어떤 스타일이 잘 어울릴까요? 라고 말하면 사장님이 옷 골라주는 ICT 기술이 발달하면서 온라인 쇼핑 성장 사용자가 어떤 아이템을 구매하는지 구매 기록 축적 대용량의 기록 사용하여 추천 시스템 발달 ex) 넷플릭스, 아마존 핵심은 개인의 선호도를 고려하여 적절한 아이템을 제안한 후,..

UX & HCI 2021.07.22

ADsP 데이터 분석 준전문가 PART 03 _ 요약 및 정리

1. 데이터 마이닝 단계 : 목적 정의 -> 데이터 준비 -> 데이터 가공 -> 기법 적용 (데이터 가공 : 모델링 목적에 따라 목적 변수 정의, 필요한 데이터를 데이터 마이닝 소프트웨어에 적용할 수 있도록 준비하는 단계) 2. 지도학습: 로지스틱 회귀분석, 인공신경망, 의사결정 나무 비지도학습 : SOM, 군집분석, 장바구니 분석, OLAP 3. 과대적합과대 적합 : 생성된 모델이 훈련 데이터에 너무 최적화되어 있어 작은 변화에 민감하게 반응, 데이터가 모집단의 특성을 충분히 설명하지 못할 때 자주 발생, 변수가 너무 많아 모형이 복잡할 때 생성, 과대 적합이 발생할 것으로 예상되면 학습 종료 -> 업데이터 과정 반복 -> 과대 적합 방지 4. 모형 학습과 평가를 동일한 데이터셋에서 진행하면 과적합 가..

ADsP/오답노트 2021.03.28

ADsP 데이터 분석 준전문가 PART 03 - 5장 _3 정형 데이터마이닝

- 각 객체의 유사성을 측정 -> 유사성이 높은 대상 집단을 분류 -> 군집에 속한 개체들의 유사성과 서로 다른 군집에 속한 객체 간의 상이성 규명하는 분석 방법 - 특성에 따라 고객을 여러 개의 배타적인 집단으로 나누는 것 - 결과는 구체적인 군집분석 방법에 따라 차이남 - 군집의 개수나 구조에 대한 가정 없이 데이터들 사이의 거리를 기준으로 군집화 유도 - 마케팅 조사에서 소비자들의 상품 구매행동이나 life style에 따른 소비자군을 분류하여 시장 전략 수립 등에 활용 ​ # 특징 1) 요인 분석과의 차이점 - 요인분석 : 유사한 변수를 함께 묶어주는 것 ​ 2) 판별분석과의 차이점 - 판별분석 : 사전에 집단이 나누어져 있는 자료를 통해 새로운 데이터를 기존의 집단에 할당하는 ..

ADsP/3장 2021.03.27

ADsP 데이터 분석 준전문가 PART 03 - 5장 _2 정형 데이터마이닝

- 인간 뇌를 기반으로 한 추론 모델 - 뉴런 : 기본적인 정보 처리 단위 # 역전파 알고리즘 : 비선형성의 한계점 발생 -XOR 문제를 풀지 못하는 한계 극복! ​ # 인간 뇌의 특징 - 100억 개의 뉴런, 6조 개의 시냅스의 결합체 - 인간의 뇌 : 현존하는 어떤 컴퓨터보다 빠르고, 복잡하고, 비선형적, 병렬적인 정보 시스템과 같음 - 적응성에 따라 '잘못된 답' -> 뉴런들 사이의 연결 약화, '올바른 답' -> 연결 강화 ​ # 인간의 뇌 모델링 - 뉴런은 가중치가 있는 링크들로 연결 - 뉴런은 여러 입력 신호를 받지만 출력 신호는 오직 하나만 생성 ​ # 인공 신경망의 학습 - 신경망: 가중치를 반복적으로 조정하며 학습 - 뉴런 : 링크로 연결, 각 링크 : 수치적인 가..

ADsP/3장 2021.03.27

ADsP 데이터 분석 준전문가 PART 03 - 5장 _1 정형 데이터마이닝

대용량 데이터에서 의미 있는 패턴 파악, 예측 -> 의사결정에 활용하는 방법 ​ # 통계 분석과의 차이점 - 통계 분석 : 가설이나 가정에 따른 분석이나 검증 - 데이터마이닝 : 다양한 수리 알고리즘을 이용해 데이터베이스의 데이터로부터 의미 있는 정보를 찾아내는 방법을 통칭 ​ # 종류 정보를 찾는 방법론에 따른 종류 분석대상, 활용목적, 표현방법에 따른 분류 * 인공지능 의사결정나무 K-평균 군집화 * 연관분석 * 회귀분석 * 로짓 분석 * 최근접 이웃 * 시각화 분석 * 분류 * 군집화 * 포케스팅 # 데이터 마이닝의 최근 환경 - 데이터 마이닝 도구가 다양하고 체계화되어 환경에 적합한 제품을 선택하여 활용 가능 - 알고리즘에 대한 깊은 이해가 없어도 분석에 큰 어려움 없음 - ..

ADsP/3장 2021.03.27

ADsP 데이터 분석 준전문가 PART 03 - 4장_3 통계 분석

- 시간의 흐름에 따라 관찰된 값들 - 시계열 데이터의 분석을 통해 미래의 값 예측 -> 경향, 주기, 계절성 파악 - 목적: 외부인자와 관련해 계절적인 패턴, 추세와 같은 요소를 설명할 수 있는 모델을 결정하는 것 - 시계열 데이터의 모델링 : 탐색목적, 예측목적 - 짧은 기간동안의 주기적인 패턴 -> 계절변동 - 잡음: 무작위한 변동, 원인 알려지지 X ​ # 비정상 시계열 자료 : 시계열 분석을 실시할 때 다루기 어려운 자료 ​ * 평균이 일정할 경우 : 모든 시점에 대해 일정한 평균 ! => 그렇지 않은 경우 차분(difference)을 통해 정상화 * 분산이 일정 : 시점에 의존하지 않고 일정 ! => 그렇지 않을 경우 변환(Transformaion)을 통해 정상화 * 공분산..

ADsP/3장 2021.03.27