240612 TIL
Python
- index
리스트, 문자열, 튜플 등에서 특정 요소의 첫 번째 위치를 찾는 데 사용
요소를 찾으면 그 요소의 인덱스를 반환하고, 요소가 없으면 'ValueError' 예외를 발생
- format
문자열 안에 변수 값을 삽입하거나 특정 형식으로 출력
[SQL 과제] Lv3. 이용자의 포인트 조회 하기
users 테이블에는 있으나 point_users에는 없는 유저들의 point를 0으로 처리하기
SELECT u.user_id, u.email, COALESCE(pu.point, 0) point
FROM users u left join point_users pu on u.user_id = pu.user_id
order by 3 DESC
ADsP 자격증 강의
- 4가지 분석 주제
분석의 대상 (What) | |||
Known | Un-Known | ||
분석의 방법 (How) |
Known | 최적화 Optimization |
통찰력 Insight |
Un-Known | 해결책 Solution |
발견 Discovery |
- 목표 시점별 분석 기획
과제 중심적인 접근 방식 : 과제를 빠르게 해결해야 하는 경우
장기적인 마스터플랜 방식 : 지속적인 분석 내재화를 위한 경우
- 분석 기획 시 고려사항
가용 데이터 고려 (Available Data)
적절한 활용 방안과 유스케이스의 탐색 (Proper Business Use Case)
장애요소에 대한 사전 계획 수립 (Low Barrier Of Execution)
- 분석 방법론이 적용되는 업무 특성에 따른 모델
폭포수 모델 (Waterfall Model)
프로토타입 모델 (Prototype Model)
나선형 모델 (Spiral Model)
계층적 프로세스 모델
- KDD 분석 방법론 프로세스
Knowledge Discovery in Database
테이터셋 선택 > 데이터 전처리 > 데이터 변환 > 데이터 마이닝 > 데이터 마이닝 결과 평가
- CRISP-DM 분석 방법론
분석 기획 > 데이터 준비 > 데이터 분석 > 시스템 구현 > 평가 및 전개
KDD 분석 방법론과 비슷하나 조금 더 세분화 되어 있음
각 단계는 단방향으로 구성되어 있지 않고 단계 간 피드백을 통해 단계별 완성도를 높임
- 빅데이터 분석 방법론 5단계 플로우
Cross Industry Standard Process for Data Mining
- 분석 과제의 5가지 주요 속성을 고려한 관리
데이터의 양 (Date Size)
데이터 복잡도 (Data Complexity)
분석의 속도 (Speed)
분석 복잡도 (Analytic Complexity)
정확도 & 정밀도 (Accuracy & Precision)
- time boxing
현재 할당된 작업이 주어진 시간 동안 완수되지 못했더라도 다음 작업으로 넘어감