본문 바로가기
데이터분석/TIL

240617 TIL

by Freely_ 2024. 6. 17.
728x90
반응형

Python

remove

리스트에서 특정 요소를 제거하는 데 사용

리스트에서 첫 번째로 나타나는 요소를 삭제

리스트에 제거할 요소가 없으면 'ValueError' 예외가 발생

 

list.remove(x)

list - 요소를 제거할 리스트

x - 리스트에서 제거할 요소


ADsP

연속확률분포

가능한 값이 실수의 어느 특정구간 전체에 해당하는 확률변수를 의미, 확률밀도함수


균일 분포

모든 확률변수 X가 균일한 확률을 가지는 확률 분포


*정규 분포

평균이 μ 이고, 표준편차가 σ 인 분포, 표준편차가 클 경우 퍼져 보임


t-분포

통계적으로 표본으로부터 모집단의 평균에 대한 추정을 할 때 사용되는 분포

평균이 0을 중심으로 좌우가 동일한 분포를 따름

두 집단의 평균이 동일한지 알고자 할 때 검정통계량으로 활용


카이제곱 분포

표준정규분포를 따르는 확률변수들의 제곱을 합한 분포


***추정과 가설검정
점추정

모수가 특정한 값일 것이라고 추정하는 것


구간추정

일정한 크기의 신뢰 수준으로 모수가 특정한 구간에 있을 것이라고 선언하는 것

항상 추정량의 분포에 대한 전제가 주어져야 하고, 구해진 구간 안에 모수가 있을 가능성의 크기(신뢰 수준)가 주어져야 함

신뢰도(신뢰 수준)로는 90%, 95%, 99%의 확률을 많이 이용함


*가설검정

귀무가설

'비교하는 값과 차이가 없다, 동일하다'를 기본 개념으로 하는 가설

실험, 연구를 통해 기각하고자 하는 어떤 가설로 대립가설과 상반되는 개념

 

대립가설

뚜렷한 증거가 있을 때 주장하는 가설

귀무가설이 틀렸다고 판단될 경우 채택

증명하고자 하는 새로운 아이디어 또는 가설에 해당

 

모수검정

검정하고자 하는 모집단의 분포에 대한 가정을 하고 그 가정 하에 검정통계량과 점정통계량의 분포를 유도해 검정을 실시

 

비모수검정

자료가 추출된 모집단의 분포에 대해 아무 제약을 가하지 않고 검정을 실시

자료가 30개 미만으로 많지 않거나 개체 간의 서열관계를 나타내는 경우에 이용

 

기술통계

자료의 특성을 표, 그림, 통계량 등을 사용해 쉽게 파악할 수 있도록 정리 또는 요약하는 것


상자그림

다섯 숫자 요약을 통해 그림으로 표현한 것 (최솟값, Q1, Q2, Q3, 최댓값)


종속변수

다른 변수의 영향을 받는 변수

 

독립변수

다른 변수에 영향을 주는 변수, 종속변수의 원인


*산점도

두 변수 간의 관계를 시작적으로 나타내는 그래픽 표현 방법 중 하나

산점도에서 확인할 사항

- 두 변수 사이의 선형관계(직선관계)가 성립하는가?

- 두 변수 사이의 함수관계(직선관계 또는 곡선관계)가 성립하는가?

- 이상값이 존재하는가?

- 몇 개의 집단으로 구분(층별) 되는가?

728x90
반응형

'데이터분석 > TIL' 카테고리의 다른 글

240620 TIL  (0) 2024.06.20
240614 TIL  (0) 2024.06.14
240613 TIL  (0) 2024.06.13