Data analysis

Process Mining의 기초

sujii 2021. 10. 19. 03:24
반응형

프로세스 모델 : 행위의 순서, 의사결정 지점, 시간 정보, 작업자 정보 등 포함


* 목적
- 모델링 과정에서 다양한 각도에서 프로세스를 바라볼 수 있음
- 시스템 형상 관리를 위해 사용
- 관련 인증 획득과 교육을 위해 문서화
- 시스템이나 처리과정에서의 오류를 찾기 위해 활용

* 한계
- 모델과 실제 상황의 연계 부족
- 재설계 도출, 신규 시스템 구현 실패 등 문제점 야기

1) 프로세스 모델에 관심이 있고,
2) 이벤트 데이터가 충분하며,
3) 수작업으로 작성한 모델의 한계가 있는 상황에서
* 이벤트 데이터와 모델을 연계하는 것이 의미가 있음*

 


* Pertri - net
- 토큰, 활성화, 점화, 마킹
- 점화의 조건 : Transition이 활성화가 되어야 한다.


* BPMN
- XOR, AND로 구성되어 있음

* YAML

* BPM Lifecycle
- 프로세스를 만들고 활용하고 다시 재설계하는 것을 원활하게 할 수 있는 사이클 정의
프로세스 마이닝은 정보 시스템을 통해 기록된 데이터로 실제 프로세스를 분석함 -> BPM Lifecycle은 잘 관리할 수 있는 가능성 제공
- data: 진단, 구현
- models: 설계, 구성

 

 

 


 

 


* 프로세스 마이닝
- 기계학습과 데이터마이닝, 프로세스 모델링 및 분석의 사이에 있는 비교적 새로운 연구 분야
- event log 사용! 

 

 


* 프로세스 마이닝 종류
1) 도출 (Discovery)
- 데이터로부터 모델을 자동화된 알고리즘을 통해 만들어내는 과정
- 알파알고리즘

2) 적합도 검사 (Conformance checking)
- 프로세스 모델과 이벤트 로그 비교
- 부정 사례 발견
- 데이터  평가: 로그에 기록된 현실이 모델이 부합하는지
- 모델 평가 : 모델이 현실에 부합하는지 확인

3) 향상 (Enhancement)
- 프로세스 관련 정보를 활용하여 모델 확장 및 개선
- 모델 수선, 확장

 


* 프로세스 마이닝 네가지 관점
1) 프로세스 흐름 관점
- 제어 흐름, 작업 순서 중심
- and, or, xor
2) 조직 관점
- 사람, 시스템, 역할 부서 등 중심
- 조직 구조화, 소셜 네트워크
3) 케이스 중심
- 특정한 케이스 중심 (특정 프로세스가 성공하는지 예측)
4) 시간 중심
- 이벤트의 시간과 빈도 중심
- 병목 현상 도출, 서비스 수준 측정, 운영 케이스의 남은 시간 예측 등

 


* 프로세스 마이닝 적용 방법
- offline : 프로세스를 개선할 목적으로 사후에 분석하는 것
- online : 프로세스가 진행되고 있는 도중에 분석하는 것

 

 


 

 


* 이벤트 로그
- 이벤트 : 특정한 작업과 케이스에 관련
- 작업 : 프로세스를 구성하는 명확하게 정의된 하나의 단계
- 케이스: 프로세스를 거치는 각 구분자
- 자취 : 케이스별로 기록되는 작업의 순서

* Underfitting
- 미 있는 Train set도 학습을 하지 못한 상태를 의미
- 기존 traces보다 더 많이 포함함
- 너무 헐렁하게 예측
- 즉, 모델이 로그에 나타난 것들과는 너무 다른 행위들도 표현하고 있다는 것이다

* Overfitting
- 학습 데이터(Training Set)에 대해 과하게 학습된 상황
- 특정 데이터만 예측할 수 있음
- 특정 예제 로그만 표현하고 있음

 

 


* 프로세스 discovery
- 과적합, 과소적합을 잘 고려해야 함
- concurrency 동시성 모델링의 중요성
- noise : 모델에 포함되어서는 안 되는 예외적이고 빈도가 낮은 패턴
- incompleteness : 발생 가능한 형태가 다양해서 로그에 그중 일부만 포함된 경우

* play-out : 실제화
- 프로세스 모델에서 이벤트 로그로
- 실험 수행을 위한 시뮬레이션 툴에서 사용
- model checking에서 사용

* play-in : 모형화
- 이벤트 로그에서 프로세스 모델로 : 알파 알고리즘
- 데이터마이닝은 모델을 만드는 것은 아님, 프로세스 마이닝만이 프로세스 모델 발견 가능

* replay
- 이벤트 로그와 프로세스 모델
- 적합도 검사, 모델 확장, 예측 모형 구축, 운영 지원

* 프로세스 마이닝은 프로세스를 발견하고 자세히 들여다봄으로써 비효율을 분석하여 필요 없는 activity를 제거하거나 낭비를 줄일 수 있음




'Data analysis' 카테고리의 다른 글

Conformance Checking  (0) 2021.10.19
Process discovery(Heuristic Mining)  (0) 2021.10.19
Process Mining의 기초 2  (0) 2021.10.19
프로세스 마이닝 (Process Mining)  (0) 2021.10.13
딥러닝(Deep Learning)  (0) 2021.10.13