본문 바로가기

반응형

pandas

92일차 코딩학원(pandas, csv 문제. 특정 열 값을 추출하고 그래프로 출력하기) 능력단위 평가 판다스를 이용하여 외부 파일(sales_data.csv)을 읽어들이고, 해당 파일의 판매 데이터를 활용하여 시각화 결과가 나오게 구현하시오. 문제 풀이 import pandas as pd import matplotlib.pyplot as plt # CSV파일 불러오기 sales_data1 = pd.read_csv('./sales_data_.csv') # 각 열 출력하기 sales_data2 = sales_data1[['month', 'tv', 'laptop', 'phone']] print(sales_data2) # 각 열 추출하기 a = sales_data2['month'] print(a) b = sales_data2['tv'] print(b) c = sales_data2['laptop'].. 더보기
91일차 코딩학원 공부내용 정리 6/9 마지막 발표. 마무리가 되면 springboot 사용 연습함. [1, 1, 1, 2, 2, 2, 100] 처럼 데이터가 고르지 않을 때(너무 크거나 작은 값이 포함될 때) 평균보다 중간값이 유효하다. 데이터는 많으면 좋다. 새로운 column을 추가해보자. 실제 데이터 관리자들은 뻥튀기를 하기도 한다. 결과가 좋게 나오기 때문. 상관계수. 타이타닉호에 탄 사람들 중 1등석에 탄 사람들의 생존률은 상관관계가 있을까? 1등석과 생존율의 관계. 공분산은 관계의 방향(+, -, 0)만 알 수 있고 정도는 알 수 없다. 공분산을 보완하는 개념이 상관계수다. NaN값은 삭제하거나 치환하는 처리가 필요하다. 코드 Age_double 칼럼을 추가했다. column을 추가했다. drop()을 사용해.. 더보기
파이썬 pandas 선생님 말씀 : 평일에 빡세다고 느껴야 잘가고 있는 것... 1. pandas 판다스는 파이썬의 데이터 분석 라이브러리다. 기본적으로 넘파이를 사용한다. import pandas as pd #pandas 모듈 호출 import numpy as np #numpy 모듈 호출 from pandas import Series, DataFrame list_data = [1,2,3,4,5] list_name = ["a","b","c","d","e"] example_obj = Series(data= list_data, index=list_name) print(example_obj) print(example_obj.index) print(example_obj.values) print(type(example_obj.val.. 더보기

반응형