'2025/02 글 목록

sk네트웍스 family AI 캠프 11기 4주차 회고록

4차 회고기간 : 2025.02.24월~2025.02.28금이번주는 3일 간의 프로젝트, 2일 간의 데이터분석(numpy 이론) 수업이 진행되었다우당탕탕 지나가버린 일주일을 정리해보겠습니닷02.24월 ~ 02.26수 sk네트웍스 family AI 캠프 1차 프로젝트 회고🖥️ 1. 프로젝트 소개"연령별 신차 구매 트렌드 분석 및 FAQ 플랫폼"인터넷 각 사이트에서는 신차 등록 데이터를 개별적으로 제공하고 있지만, 연령 별 구매 패턴을 한눈에 파악할 수 있는 시각dscience26.tistory.com GitHub - SKNETWORKS-FAMILY-AICAMP/SKN011-1st-5TeamContribute to SKNETWORKS-FAMILY-AICAMP/SKN011-1st-5Team developm..

SKN/Remind 2025.02.28

02. numpy [통계] [정렬] [병합]

1. 통계 기초01. 모집단과 표본모집단(Population): 연구 대상 전체를 의미하며, 모든 데이터를 포함한다.ex) 특정 나라의 모든 사람의 키 데이터표본(Sample): 모집단의 일부를 추출한 데이터를 의미하며, 모집단의 특성을 추정하는 데 사용된다.02. 기술통계와 추론통계기술통계 : 데이터를 요약하고 설명하는 데 사용되는 통계 기법이다. 평균, 중앙값, 최빈값, 표준편차 등이 포함추론통계 : 표본 데이터를 사용하여 모집단에 대한 추론을 수행하는 통계 기법이다. 가설 검정, 신뢰 구간 등이 포함03. 이산값과 연속값이산값특정한 값을 가지는 데이터로, 정해진 간격이나 구간 안에서만 나타난다값들이 셀 수 있는 숫자처럼 구분되어 있어 중간값이 없다ex) 주사위 눈(1, 2, 3, 4, 5, 6), ..

SKN/04. Data Analysis 2025.02.28

01. numpy overview

1. 배열 및 인덱싱01. ndarray 생성(1) 리스트로부터 생성# 리스트로부터 생성import numpy as nparr = np.array([1, 2, 3, 4])print(arr) (2) n으로 채운 배열# 0으로 채운 배열 생성arr = np.zeros((2, 3)) # 2x3 배열print(arr)# 1로 채운 배열 생성arr = np.ones((3, 2)) # 3x2 배열print(arr) (3) 수열을 가진 배열# 연속적인 값으로 배열 생성arr = np.arange(0, 10, 2) # 0부터 9까지 2씩 증가하는 값print(arr)# 등간격으로 배열 생성arr = np.linspace(0, 1, 5) # 0에서 1까지 5개의 등간격 값print(arr)# 지수 | 로그로 배열..

SKN/04. Data Analysis 2025.02.28

07. 크롤링 도구

1. BeautifulSoup01. BeautifulSoup 개요💡Beautiful Soup은 Python 기반의 HTML, XML 파일을 파싱(parsing)하여 데이터를 추출하는 라이브러리이다. 이미 다운로드된 HTML 문서를 파싱하여 DOM(Document Object Model) 트리를 생성하고, DOM 트리를 탐색하 여 원하는 태그나 속성에 접근하고 데이터를 추출한다. 웹 페이지의 구조를 이해하고 필요한 데이터를 정제해 추출하는 데 적합하다. 02. BeautifulSoup 장단점장점가볍고 사용법이 간단하다.HTML 구조에서 특정 태그나 속성에 쉽게 접근 가능하다.빠른 파싱 속도를 제공한다.단점동적 웹 페이지(JavaScript 렌더링) 크롤링은 불가능하다.HT..