코딩학원 공부내용 정리
1. 지금하는 개발자 풀스택 과정은 적어도 6년이 걸려야 숙달할 수 있는 내용으로 구성되어 있다. 지금 따라가지 않으면 나중에도 따라가지 못한다. 수업은 기본이고 개인적으로 심화학습을 해야한다. 쉬워보이는 것들도 내가 다 안다고 할 수 없다.
2. 지난 주 금요일 시험 문제를 잘못 풀었다. 문제 출제자가 메서드를 요구했다. 나는 메서드를 만든 것이 아니라 출력만했다. 문제 정의부터 꼼꼼하게 보자. 아래는 로또 번호 뽑는 메서드다. 1~45번까지의 숫자로 범위를 설정하고, 뽑혀 나오는 수는 6개, 중복 불가로 설정해준다.
def generate_lotto_nums():
return np.random.choice(np.arange(1,46), size=6, replace=False)
generate_lotto_nums()
array([31, 11, 6, 1, 34, 37])
3. pandas 연습이 끝나고, AI 입문 과정에 들어간다.
4. Visual Studio 설정을 다르게 해봐야겠다. 설정하는 키를 못찾아서 헤맸다.
Visual Studio 설정하기 : 파일 → 기본 설정 → 설정
캡쳐 단축키 : 윈도우 버튼 + Print Screen → 사진/스크린샷에 저장됨.


5. AI는 데이터, 통계학과 연관성이 크다. EDA, 기술통계, 추리통계에 대해 학습하고 있다.
1. 기술 통계
0) 데이터에서 측정할 수 있는 요약된 수치값들
1) 수집한 자료를 분석하여 대상들의 속성을 파악하는 통계 방법
- 중심경향값
- 평균 : 수치 총합 / 전체 자료 수
- 중심(중앙)값 : 최대 - 최소의 정가운데 수치
오름차순으로 정렬했을 때, 한가운데 있는 값
- 최빈값 : 가장 많은 빈도를 보이는 수치,
데이터 중에서 가장 많이 등장한 횟수
- 사분위수
- 오름차순으로 정렬해서 4등분한 지점
- 25% / 50% / 75%
- 분산도
- 분산 : 분산은 각 데이터가 평균으로부터 떨어진 거리(편차)의 제곱을 나타내는 값입니다. 그리고 이 제곱된 편차 들의 평균.
- 표준분산 : 분산에 제곱근을 취한 수치
- 상관계수
- 회귀계수
2. 추리 통계
1) 모집단을 대표하는 표본을 추출하고
표본의 기술통계를 이용하여
모집단의 속성들을 유추하는 통계방법
- 표본집단 ====> 모집단
추정
2) 신뢰구간
- 추리통계에서 예측한 모집단의 특성이 위치할 가능성이 높은 구간
- 표본에서 구해지는 기술통계값들을 이용하여 계산되며, 95%, 99%, 99.9% 신뢰수준에 따라 달라짐
- 95%보다 99%가 신뢰수준이 높다.
1. EDA 정의
1) Exploratory Data Analysis
2) 탐색적 데이터 분석
3) data => EDA => 인사이트
----
통계분석
시각화
2. EDA의 필요성 (효과)
1) 데이터 이해할 수 있도록 도와줌
2) 가설을 추가하거나 수정할 수 있음
3. 가설 수립 검정하기
1) 반복으로 구성됨
가설 수립 ==> EDA를 통한 가설 검정 => Insight 획득, 구체화 (주식투자에서도 흔히 사용된다. 데이터 수집, 가설 수립 및 검정)
2) 예시
- 보험 가입 기간이 긴 고객일수록 이탈율이 줄어들 것이다.
- 건물별 화재 예측을 하는데 필요한 특징을 선정하는데 EDA를 수행함.
- 밸브의 불량이 발생하는 공정상 원인 파악
'코딩 학원(국비지원)' 카테고리의 다른 글
91일차 코딩학원 (2) | 2023.06.01 |
---|---|
90일차 코딩학원 (3) | 2023.05.31 |
코딩학원 88일차. 파이썬, Git (6) | 2023.05.25 |
코딩학원 87일차 (0) | 2023.05.24 |
코딩학원 86일차 (4) | 2023.05.23 |