Data analysis 7

Enhancement

* Enhancement 일단 정리 프로세스 마이닝의 3가지 타임 1. discovery : 알파마이닝 2. conformance : 적합도 검사 Token replay 3. enhancement : repair, extension이 있음 extension을 통해 로그와 모델을 상호 연관 시킴으로써 model에 새로운 관점 도입(리소스 or 시간) => 통합된 모델 구축 # 관점 - 조직적 관점 : social networks 등에 대한 인사이트 도출 - 시간 관점 : bottleneck 분석, 4가지 관점으로 확장 가능(Time, cost, quality, flexability), 성과측정 - 비용 관점 : 의사결정을 이해하고 cases 사이의 차이점 분석 "추가된 정보를 바탕으로 어떤 새로운 정보를 ..

Data analysis 2021.10.20

Conformance Checking

# 프로세스 모델과 로그의 관계 1) play-out: 모델이 로그를 생성 2) play-in: 로그로부터 모델을 생성 3) replay: 로그와 프로세스 모델 활용, 로그가 모델에서 replay됨으로써 다양한 현상 분석 Conformance Checking # Conformance Checking의 목적 프로세스 모델의 자취와 로그의 자취를 비교함으로써 공통점과 차이점을 파악 전체적인 비교 결과 수치 뿐만 아니라 세부적인 차이 파악에 활용 - 부정사례 발견! - 데이터 평가: 로그에 기록된 현실이 모델이 부합하는지 - 모델 평가 : 모델이 현실에 부합하는지 확인 # 로그와 모델의 비매칭의 결과 해석 * 서술적(모델 관점) : 모델이 현실을 더 파악하기 위해 향상될 필요가 있다는 것을 의미 Descrip..

Data analysis 2021.10.19

Process discovery(Heuristic Mining)

Process discovery * 목표 : 각 이벤트를 잘 설명하는 프로세스 모델 만들기 noise -> 프로세스 모델을 그룹화함으로써 해결 # Representation Bias ex) 알파알고리즘 - 병렬(XOR, AND)설명, OR 설명하지 못함, 루프 처리 못함 - !! 빈도수를 고려하지 않고 activity의 순서만 고려 !! -> DFG 마이닝 등장 (알파보다 더 단순한) DFG mining - trace내 작업의 선후 관계를 바탕으로 도출하는 모델 - 가장 기초적인 모델, xor과 and등 control-flow의 도출이 어렵다. - 복잡한 모델을 임계치를 활용하여 단순화하게 만든다. * 휴리스틱 마이닝 - 모델 생성시 이벤트의 빈도와 순서 고려 - 빈버하지 않은 행동은 모델에 포함시키지 ..

Data analysis 2021.10.19

Process Mining의 기초 2

* 이벤트 로그 - 케이스의 사례의 모음 - 케이스 : 이벤트의 흔적/순서 - 각 이벤트는 case, 활동, 시점 의미 ' * 이벤트 로그는 어디에서? - 데이터베이스 시스템 - 거래 로그 - ERP 시스템 - PAIS * 이벤트 로그를 통해 case들의 패턴을 파악 -> 다른 관점에서 해석 * 이벤트 로그의 확장 - 한 개의 이벤트는 시작, 종료 외 다양한 이벤트 타입을 포함할 수 있음 # case attributes : 변화하지 않음 (성별, 생일) # event attributes : 변화할 수 있음 (특정 작업과 연관) Transition System TS = (S, A, T) - S: states, A: activities, T: Transitions - 가장 기초적인 프로세스 모델링 방법 - ..

Data analysis 2021.10.19

Process Mining의 기초

프로세스 모델 : 행위의 순서, 의사결정 지점, 시간 정보, 작업자 정보 등 포함 * 목적 - 모델링 과정에서 다양한 각도에서 프로세스를 바라볼 수 있음 - 시스템 형상 관리를 위해 사용 - 관련 인증 획득과 교육을 위해 문서화 - 시스템이나 처리과정에서의 오류를 찾기 위해 활용 * 한계 - 모델과 실제 상황의 연계 부족 - 재설계 도출, 신규 시스템 구현 실패 등 문제점 야기 1) 프로세스 모델에 관심이 있고, 2) 이벤트 데이터가 충분하며, 3) 수작업으로 작성한 모델의 한계가 있는 상황에서 * 이벤트 데이터와 모델을 연계하는 것이 의미가 있음* * Pertri - net - 토큰, 활성화, 점화, 마킹 - 점화의 조건 : Transition이 활성화가 되어야 한다. * BPMN - XOR, AND로..

Data analysis 2021.10.19

프로세스 마이닝 (Process Mining)

프로세스마이닝(Process Mining) 프로세스 : 특정 결과를 달성하기 위한 과정 ex) 카페에서 음료 시키는 과정 - 카페 들어가기, 음료 고르기, 주문, 계산, 픽업 - 프로세스를 기반으로 한 데이터 분석 기법 - 다양한 시스템에 기록된 데이터인 이벤트 로그(event log)를 분석 - 이벤트 로그 데이터 분석을 통해 어떤 일이 어떻게 흘러가는지, 어떤 상품이 어떤 과정으로 제작되는 지, 한 고객이 서비스 내에서 어떤 여정을 거치는 지 등의 프로세스를 도출해 가시화하여 줌 프로세스마이닝의 장점 프로세스를 투명하고 정확하게 짚어낼 수 있음 어떤 고객이 어떤 작업으로 서비스를 이용하는지 예측 가능 적합도 진단, 재작업, 낭비 구간 개선을 통한 비용 절감, 작업 시간 단축, 업무나 작업자별 성과 모..

Data analysis 2021.10.13

딥러닝(Deep Learning)

딥러닝(Deep Learning) 딥러닝 : 인공지능의 한 분야 "인공지능 > 머신러닝 > 표현학습 > 딥러닝" 인공지능(AI) - 기계가 인간의 인지 과정을 모방하는 것 (인지과정 : 학습, 문제 해결) 머신러닝 - 기계가 데이터로부터 패턴을 추출하여 스스로 지식을 획득(학습) - 표현을 출력으로 사상하는 방법 - 실세계의 지식이 관여하는 문제와 주관적으로 보이는 의사 결정 문제 해결 표현학습 - 표현 자체까지도 인공지능 시스템이 학습하는 것 - 과제에 맞는 특징 집합을 추출하는 것이 문제 해결에 중요 - 하지만 어떤 특징을 추출할지 알기 어려운 과제도 많음 Deep Learning 간단한 표현들을 이용하여 문제를 해결하는 방법 - 여러 층을 가진 인공신경망을 사용하여 머신러닝 학습을 수행하는 것 - ..

Data analysis 2021.10.13