데이터분석/TIL

240612 TIL

Freely_ 2024. 6. 12. 18:15
728x90
반응형

Python

- index

리스트, 문자열, 튜플 등에서 특정 요소의 첫 번째 위치를 찾는 데 사용

요소를 찾으면 그 요소의 인덱스를 반환하고, 요소가 없으면 'ValueError' 예외를 발생

 

- format

문자열 안에 변수 값을 삽입하거나 특정 형식으로 출력


[SQL 과제] Lv3. 이용자의 포인트 조회 하기

users 테이블에는 있으나 point_users에는 없는 유저들의 point를 0으로 처리하기

SELECT u.user_id, u.email, COALESCE(pu.point, 0) point

FROM users u left join point_users pu on u.user_id = pu.user_id

order by 3 DESC


ADsP 자격증 강의

 

- 4가지 분석 주제

  분석의 대상 (What)
Known Un-Known
분석의 방법
(How)
Known 최적화
Optimization
통찰력
Insight
Un-Known 해결책
Solution
발견
Discovery


- 목표 시점별 분석 기획

과제 중심적인 접근 방식 : 과제를 빠르게 해결해야 하는 경우

장기적인 마스터플랜 방식 : 지속적인 분석 내재화를 위한 경우


- 분석 기획 시 고려사항

가용 데이터 고려 (Available Data)

적절한 활용 방안과 유스케이스의 탐색 (Proper Business Use Case)

장애요소에 대한 사전 계획 수립 (Low Barrier Of Execution)

 

- 분석 방법론이 적용되는 업무 특성에 따른 모델

폭포수 모델 (Waterfall Model)

프로토타입 모델 (Prototype Model)

나선형 모델 (Spiral Model)

계층적 프로세스 모델

 

- KDD 분석 방법론 프로세스

Knowledge Discovery in Database

테이터셋 선택 > 데이터 전처리 > 데이터 변환 > 데이터 마이닝 > 데이터 마이닝 결과 평가

 

- CRISP-DM 분석 방법론

분석 기획 > 데이터 준비 > 데이터 분석 > 시스템 구현 > 평가 및 전개

KDD 분석 방법론과 비슷하나 조금 더 세분화 되어 있음

각 단계는 단방향으로 구성되어 있지 않고 단계 간 피드백을 통해 단계별 완성도를 높임


- 빅데이터 분석 방법론 5단계 플로우

Cross Industry Standard Process for Data Mining


- 분석 과제의 5가지 주요 속성을 고려한 관리

데이터의 양 (Date Size)

데이터 복잡도 (Data Complexity)

분석의 속도 (Speed)

분석 복잡도 (Analytic Complexity)

정확도 & 정밀도 (Accuracy & Precision)


- time boxing

현재 할당된 작업이 주어진 시간 동안 완수되지 못했더라도 다음 작업으로 넘어감

728x90
반응형