본문 바로가기

분류 전체보기

(68)
제26회 부산국제영화제 일정 올해도 어김없이 부산국제영화제가 다가오고 있다. 19년에 삼 박 사일로 너무 알차게 보고 와서인지 작년에는 생일이랑 겹치면서 일박이일로 짧게 다녀온 것이 아쉬웠다. 올해는 어떻게 될지 모르겠지만 가능하면 올해도 좀 알차게 다녀오고 싶은데. 그래도 삼 박 사일로 다녀올 때는 숙박비를 줄이느라 게스트 하우스에서 불편하게 머물렀다면 작년엔 호텔에서 잤기에 그건 만족스러웠다 ㅋㅋ 올해는 10월 6일 수요일부터 10월 15일 금요일까지 진행될 예정이다. 10월이면 백신 접종을 마친 사람들도 많아질 테니 부디 무사하게 진행돼서 즐겁게 관람할 수 있게 되길 바란다.
웹 크롤링 기초 - 멜론 실시간 top100 순위 정보 크롤링 개요 selenium 라이브러리의 webdriver을 활용해 웹 브라우저를 조작하고, BeautifulSoup 라이브러리를 활용해 웹 페이지 상의 HTML 데이터에서 필요한 정보를 가져올 수 있음. 라이브러리 및 기타 준비 # selenium 설치 !pip install selenium # selenium 라이브러리 불러오기 from selenium import webdriver # 크롬드라이버 준비 - 크롬 드라이버는 별도 다운로드 필요 아래 더보기에 다운로드 링크 첨부 driver = webdriver.Chrome('./chromedriver.exe') # BeautifulSoup 라이브러리 불러오기 from bs4 import BeautifulSoup 더보기 Downloads - ChromeDriv..
미니 프로젝트(1) 첫번째 미니프로젝트 2인 1조로 진행. 일정은 빠르면 8월 25일 오후부터 26일 저녁까지 혹인 26일 하루동안 진행될 예정. 주제 : Covid-19 웹 크롤링 최근 일주일 신규확진자 수 등의 통계정보 수집 MySQL의 테이블에 저장 간단한 데이터 분석 - 웹 크롤링으로 최근 일주일 신규 확진자수 수집 - 중환자 수, 해외유입 등 통계 정보 웹 화면에서 불러오기 - mysql 테이블에 저장하고 저장된 데이터를 가지고 다시 파이썬에 불러들여서 간단한 데이터 분석 or 통계정보 - 가능하면 데이터 시각화(그래프 그리기) - 배운 내용을 이용해서 결과를 잘 나오게 하면 됨 - 일단은 잘 작동되고, 요구하는 내용이 잘 녹아들어있으면 좋은 점수 - 플러스 알파로 발표나 디자인적 요소. 보고서 잘 만들기. 잘보여..
코딩테스트 연습 - 뉴스 클러스터링(못품) [문제] 유사한 기사를 묶는 기준을 정하기 위해서 논문과 자료를 조사하던 튜브는 "자카드 유사도"라는 방법을 찾아냈다. 자카드 유사도는 집합 간의 유사도를 검사하는 여러 방법 중의 하나로 알려져 있다. 두 집합 A, B 사이의 자카드 유사도 J(A, B)는 두 집합의 교집합 크기를 두 집합의 합집합 크기로 나눈 값으로 정의된다. 예를 들어, 집합 A = {1, 2, 3}, 집합 B = {2, 3, 4}라고 할 때, 교집합 A ∩ B = {2, 3}, 합집합 A ∪ B = {1, 2, 3, 4}이 되므로, 집합 A, B 사이의 자카드 유사도 J(A, B) = 2/4 = 0.5가 된다. 집합 A와 집합 B가 모두 공집합일 경우에는 나눗셈이 정의되지 않으니 따로 J(A, B) = 1로 정의한다. 자카드 유사도..
MySQL - SQL 기본(1) 1. SELECT문 SELECT 열 이름 FROM 테이블이름 WHERE 조건절 GROUP BY 열 이름 HAVING 집계함수에 대한 조건절 ORDER BY 열 이름 -- HAVING절은 GROUP BY절 다음 순서. -- ORDER BY는 가장 마지막 순서. USE; 데이터베이스 지정 -- 쿼리를 적용할 데이터베이스 선택 USE 데이터베이스_이름; AS; 열 이름 별칭 지정 -- 별칭에 띄어쓰기가 포함될 경우 ''로 묶어주기. SELECT 열_이름 AS 별칭, 열_이름2 별칭2, 열_이름3 '별 칭3' FROM 테이블이름 조건절 WHERE; AND, OR, BETWEEN, IN, LIKE(%, _) -- 이름이 '홍길동'인 사람에 대한 '모든 컬럼값'을 usertbl에서 불러오기 SELECT * FROM..
개발자? 데이터 사이언티스트? 비전공자로서 개발자가 뭐하는건지 쥐뿔도 모르는 상태에서 배워보겠다고 덥석 공부부터 시작하면 도대체 이걸 배워서 어디다 뭘 어떻게 쓰는거지라는 장벽에 부딪힐 것 같다. 전체적인 그림을 알고 이걸 어디다 어떻게 쓸지를 그려가며 배워야 한다. 가장 먼저 구분해야할건 빅데이터 어쩌구 하면서 데이터 과학자로 불리는 뭉태기들과 개발자의 차이다. 데이터 사이언티스트, 데이터 분석가, 데이터 엔지니어는 기존의 개발자랑은 결이 좀 다른 길인 것 같다. 데이터 엔지니어 혹은 데이터 시스템 개발자는 데이터를 수집하고 관리하고 유지하는 사람들이란다. 데이터 분석가 혹은 데이터 사이언티스트는 알고리즘과 기술을 통해 데이터를 분석하고 이를 경영자의 의사결정에 보태기 위해 시각화하고 전달하는 역할을 한다. 전자에 치중하는 사람들이..
코딩테스트 연습 - 더 맵게 (못 품) [문제] 매운 것을 좋아하는 Leo는 모든 음식의 스코빌 지수를 K 이상으로 만들고 싶습니다. 모든 음식의 스코빌 지수를 K 이상으로 만들기 위해 Leo는 스코빌 지수가 가장 낮은 두 개의 음식을 아래와 같이 특별한 방법으로 섞어 새로운 음식을 만듭니다. 섞은 음식의 스코빌 지수 = 가장 맵지 않은 음식의 스코빌 지수 + (두 번째로 맵지 않은 음식의 스코빌 지수 * 2) Leo는 모든 음식의 스코빌 지수가 K 이상이 될 때까지 반복하여 섞습니다. Leo가 가진 음식의 스코빌 지수를 담은 배열 scoville과 원하는 스코빌 지수 K가 주어질 때, 모든 음식의 스코빌 지수를 K 이상으로 만들기 위해 섞어야 하는 최소 횟수를 return 하도록 solution 함수를 작성해주세요. 제한 사항 scovill..
정렬 알고리즘(1) 정렬(sorting) 오름차순(ascending order) 내림차순(descending order) 정렬 알고리즘의 핵심은 교환 · 선택 · 삽입 버블정렬 (단순 교환 정렬) : 이웃한 두 원소의 대소관계를 비교하여 필요에 따라 교환을 반복하는 알고리즘. a[j-1], a[j] = a[j], a[j-1] 셰이커정렬 (양방향 버블 정렬) : 홀수 패스에서는 가장 작은 원소를 맨 앞으로 이동시키고, 짝수 패스에서는 가장 큰 원소를 맨 뒤로 이동. 단순 선택 정렬(straight selection sort) : 가장 작은 원소부터 선택해 알맞은 위치로 옮기는 작업을 반복하며 정렬하는 알고리즘. a[i], a[min] = a[min], a[i] 단순 삽입 정렬(straight insertion sort) : ..
코딩테스트 연습 - 짝지어 제거하기 [문제] 짝지어 제거하기는, 알파벳 소문자로 이루어진 문자열을 가지고 시작합니다. 먼저 문자열에서 같은 알파벳이 2개 붙어 있는 짝을 찾습니다. 그다음, 그 둘을 제거한 뒤, 앞뒤로 문자열을 이어 붙입니다. 이 과정을 반복해서 문자열을 모두 제거한다면 짝지어 제거하기가 종료됩니다. 문자열 S가 주어졌을 때, 짝지어 제거하기를 성공적으로 수행할 수 있는지 반환하는 함수를 완성해 주세요. 성공적으로 수행할 수 있으면 1을, 아닐 경우 0을 리턴해주면 됩니다. 예를 들어, 문자열 S =baabaa라면 baabaa →bbaa →aa→ 의 순서로 문자열을 모두 제거할 수 있으므로 1을 반환합니다. 제한사항 문자열의 길이 : 1,000,000이하의 자연수 문자열은 모두 소문자로 이루어져 있습니다. [풀이] 빈 깡통..
ADsP 1과목 - 데이터 이해 빈출 개념 1. 데이터와 정보 데이터의 정의 정성적 데이터 / 정량적 데이터 암묵지와 형식지 암묵지 → (공통화) → 암묵지 → (표출화) → 형식지 → (연결화) → 형식지 → (내면화) → 암묵지 데이터 피라미드 (Data → Information → Knowledge → Wisdom) 2. 데이터베이스 정의와 특징 데이터베이스 정의 DBMS 특징 데이터베이스 설계 절차 요구조건분석(명세서 작성) → 개념적 설계 → 논리적 설계 → 물리적 설계 데이터웨어하우스, 데이터마트 구분 데이터웨어하우스 특징 3. 데이터베이스 활용 OLTP / OLAP CRM / SCM 제조 - DW / ERP / BI 금융 - EAI / EDW / ERP / e-CRM / 블록체인 유통 - KMS / RFID 4. 빅데이터의..