분류 전체보기 63

05. matplotlib

00. matplotlib 개요(1) 한글 폰트 사용을 위한 설정import matplolib.font_manager as fmimport matplotlibfont_path = ' ' # 내 파일에 font 들어가서 경로 복사해오기font = fm.FontProperties(fname=font_path).get_name()matplotlib.rc('font', family=font) (2) figure과 axesfigure : 전체 그림이 그려지는 컨테이너axes : 그래프가 실제로 그려지는 영역 (좌표, 데이터)fig = plt.figure(figsize=(6, 4), facecolor='green') # facecolor : 그래프의 바깥 배경색 설정print(fig)ax = plt.gca()ax...

04. 데이터 결측치 확인

(1) 결측치 확인# 1. df.isna()# 2. df.isnull() (2) 결측치 처리대표값으로 결측치 대체 (평균값, 기본값, 최빈값)# df['Phone'] = df['Phone'].fillna('010-0000-0000') # 기본값# df['Phone'].value_counts() # 컬럼별로 나온 횟수 카운트# df['Phone'] = df['Phone'].fillna('010-2345-6789') # 최빈값# df.info() 결측치가 포함된 행 제거# - how='any' : 결측치 셀을 하나라도 가지고 있으면 행 제거 (기본값)# - how='all' : 모든 셀이 결측치인 경우 행 제거df = df.dropna(how='all')df.info() 2. 중복값 처리# df.duplic..

sk네트웍스 family AI 캠프 1차 프로젝트 회고

🖥️ 1. 프로젝트 소개"연령별 신차 구매 트렌드 분석 및 FAQ 플랫폼"인터넷 각 사이트에서는 신차 등록 데이터를 개별적으로 제공하고 있지만, 연령 별 구매 패턴을 한눈에 파악할 수 있는 시각화 자료나 플랫폼이 부족하다. 따라서 우리 조는 국내 신차 등록 데이터를 활용하여 연령별로 인기 있는 자동차 모델을 시각화하고, 신차 구매와 관련된 질문들을 제공하는 플랫폼을 제작하기로 했다.  진행기간2025년 2월 24일 ~ 2025년 2월 26일 (2일)팀 구성이민정, 성호진, 현유경, 이채은, 신준희  기술 스택UI 설계FigmaFrontend 및 웹 크롤러pythonstreamlitseleniumDB 및 데이터 시각화MySQLpandasmatplotlib 구현 기능신차 구매 트렌드 분석 및 FAQ 홈페이..

SKN/Remind 2025.03.03

sk네트웍스 family AI 캠프 11기 4주차 회고록

4차 회고기간 : 2025.02.24월~2025.02.28금이번주는 3일 간의 프로젝트, 2일 간의 데이터분석(numpy 이론) 수업이 진행되었다우당탕탕 지나가버린 일주일을 정리해보겠습니닷02.24월 ~ 02.26수 sk네트웍스 family AI 캠프 1차 프로젝트 회고🖥️ 1. 프로젝트 소개"연령별 신차 구매 트렌드 분석 및 FAQ 플랫폼"인터넷 각 사이트에서는 신차 등록 데이터를 개별적으로 제공하고 있지만, 연령 별 구매 패턴을 한눈에 파악할 수 있는 시각dscience26.tistory.com  GitHub - SKNETWORKS-FAMILY-AICAMP/SKN011-1st-5TeamContribute to SKNETWORKS-FAMILY-AICAMP/SKN011-1st-5Team developm..

SKN/Remind 2025.02.28

02. numpy [통계] [정렬] [병합]

1. 통계 기초01. 모집단과 표본모집단(Population): 연구 대상 전체를 의미하며, 모든 데이터를 포함한다.ex) 특정 나라의 모든 사람의 키 데이터표본(Sample): 모집단의 일부를 추출한 데이터를 의미하며, 모집단의 특성을 추정하는 데 사용된다.02. 기술통계와 추론통계기술통계 : 데이터를 요약하고 설명하는 데 사용되는 통계 기법이다. 평균, 중앙값, 최빈값, 표준편차 등이 포함추론통계 : 표본 데이터를 사용하여 모집단에 대한 추론을 수행하는 통계 기법이다. 가설 검정, 신뢰 구간 등이 포함03. 이산값과 연속값이산값특정한 값을 가지는 데이터로, 정해진 간격이나 구간 안에서만 나타난다값들이 셀 수 있는 숫자처럼 구분되어 있어 중간값이 없다ex) 주사위 눈(1, 2, 3, 4, 5, 6), ..

01. numpy overview

1. 배열 및 인덱싱01. ndarray 생성(1) 리스트로부터 생성# 리스트로부터 생성import numpy as nparr = np.array([1, 2, 3, 4])print(arr) (2) n으로 채운 배열# 0으로 채운 배열 생성arr = np.zeros((2, 3)) # 2x3 배열print(arr)# 1로 채운 배열 생성arr = np.ones((3, 2)) # 3x2 배열print(arr) (3) 수열을 가진 배열# 연속적인 값으로 배열 생성arr = np.arange(0, 10, 2) # 0부터 9까지 2씩 증가하는 값print(arr)# 등간격으로 배열 생성arr = np.linspace(0, 1, 5) # 0에서 1까지 5개의 등간격 값print(arr)# 지수 | 로그로 배열..

07. 크롤링 도구

1. BeautifulSoup01. BeautifulSoup 개요💡Beautiful Soup은 Python 기반의 HTML, XML 파일을 파싱(parsing)하여 데이터를 추출하는 라이브러리이다.     이미 다운로드된 HTML 문서를 파싱하여 DOM(Document Object Model) 트리를 생성하고, DOM 트리를 탐색하       여 원하는 태그나 속성에 접근하고 데이터를 추출한다. 웹 페이지의 구조를 이해하고 필요한 데이터를 정제해         추출하는 데 적합하다. 02. BeautifulSoup 장단점장점가볍고 사용법이 간단하다.HTML 구조에서 특정 태그나 속성에 쉽게 접근 가능하다.빠른 파싱 속도를 제공한다.단점동적 웹 페이지(JavaScript 렌더링) 크롤링은 불가능하다.HT..

06. 크롤링 도구 개요

1. 크롤링 개요01. 파이썬 크롤링 라이브러리 종류(1) Requests특징 : HTTP 요청을 간단히 처리할 수 있는 라이브러리용도 :웹 페이지의 HTML 소스를 가져오기 위해 사용REST API 호출장점 :간단하고 빠른 HTTP 요청 지원쿠키, 세션, 인증 등 지원단점 :동적 콘텐츠(JavaScript로 렌더링되는 데이터)는 처리 불가import requestsurl = 'https://example.com'response = requests.get(url)print(response.text) (2) BeautifulSoup특징 : HTML과 XML 파일을 파싱하여 구조화된 데이터를 추출용도 :정적 웹사이트에서 데이터 추출DOM 트리 탐색 및 조작장점 :HTML 구조 파싱 및 간단한 데이터 추출에 ..

05. CSS 선택자

1. CSS 선택자01. 선택자 종류(1) 선택자 문법선택자문법설명전체 선택자*모든 요소 선택태그 선택자태그이름특정 태그 요소 선택클래스 선택자.클래스이름특정 클래스를 가진 요소 선택ID 선택자#아이디이름특정 ID를 가진 요소 선택자식 선택자부모요소 > 자식요소부모 요소 바로 아래 자식 요소 선택후손(하위) 선택자조상요소 자손요소조상 요소의 하위 자손 요소 선택인접 형제 선택자요소1 + 요소2요소1 바로 뒤에 나오는 요소2 선택일반 형제 선택자요소1 ~ 요소2요소1 다음에 나오는 요소2 선택 (2) 선택자 적용전체 선택자 : *태그 선택자 : p 태그클래스 선택자 : .ID 선택자 : #자식 선택자 : .parent > .child후손 선택자 : .ancestor .descendant인접 형제 선택자 :..