Python (7) 썸네일형 리스트형 데이터분석_Logistic Regression(로지스틱회귀) 로지스틱 회귀란 무엇인가 로지스틱 회귀(Logistic Regression)는 회귀를 사용하여 데이터가 어떤 범주에 속할 확률을 0에서 1 사이의 값으로 예측하고 그 확률에 따라 가능성이 더 높은 범주에 속하는 것으로 분류해주는 지도 학습 알고리즘이다. 스팸 메일 분류기 같은 예시를 생각하면 쉽다. 어떤 메일을 받았을 때 그것이 스팸일 확률이 0.5 이상이면 spam으로 분류하고, 확률이 0.5보다 작은 경우 ham으로 분류하는 거다. 이렇게 데이터가 2개의 범주 중 하나에 속하도록 결정하는 것을 2진 분류(binary classification)라고 한다. 로지스틱 회귀를 이해하려면 우선 선형 회귀(Linear Regression)에 대한 개념을 먼저 익혀야 한다. 상세한 내용은 링크를 타고 가시면 정.. 주식투자 파이썬으로 해보자_금융데이터 수집하기#2 "주식투자 파이썬으로 해보자" 두 번째 글입니다. 지난 글(https://makes-sense.tistory.com/2?category=958178)에 이어서 종목별 상세 데이터를 가져오는 방법을 소개해드리겠습니다. #STEP 5, PER/PBR/배당수익률(개별종목) 데이터 가져오기 방식은 앞선 글에서 했던 방식과 동일한 방식을 사용합니다. 먼저 우리가 데이터를 가져올 사이트를 파보겠습니다. KRX 정보데이터시스템(data.krx.co.kr)에서 정보시스템의 [통계] > [기본통계] > [주식] > [세부안내] 중 [12021] PER/PBR/배당수익률(개별종목) 으로 들어가면 아래와 같은 화면이 나옵니다. 페이지 접속 후 F12(개발자 도구화면)을 열고 다운로드 버튼을 클릭한 후 "CSV"를 눌러줍니다.. 블라인드_기업리뷰 크롤링 크롬드라이브를 활용한 블라인드 기업리뷰 크롤링 코드입니다. 코드 작동하면 크롬이 뜨고 웹로그인 인증 후에 자동으로 기업리뷰 내용을 가져옵니다. from selenium import webdriver from selenium.webdriver.common.by import By import time import pandas as pd import re #https://www.teamblind.com/kr/ 에 접속 하여 기업리뷰 클릭 > 회사명 검색 회사명 클릭 후 리뷰의 상단 URL URL = "https://www.teamblind.com/kr/company/###/reviews" #위의 URL의 페이지의 > 버튼 클릭 후 마지막 페이지 번호 입력 lastPage =25 #이후 파일 실행 시 크롬브라우.. Jobplanet 기업리뷰 크롤링코드 잡플래닛에 있는 기업별 리뷰페이지들을 크롤링해서 엑셀로 만들어주는 코드입니다. import requests from bs4 import BeautifulSoup import pandas as pd import re login_url = 'https://www.jobplanet.co.kr/users/sign_in' #email 본인 아이디, password 본인 패스워드 입력 단, 리뷰를 남겨서 전체 접근이 가능한 상태여야함 email = '###' password = '###' LOGIN_INFO ={ 'user[email]' : email, 'user[password]' : password, 'commit' : '로그인' } session = requests.session() res = session... Softeer, [21년 재직자 대회 예선] 회의실 예약 문제 회사에는 N개의 회의실이 있다. 수많은 팀이 모여 토론하고 업무를 처리하기 위해서는 회의실이 필수적이다. 내부망에 아주 간단한 회의실 예약 시스템이 있지만 편의성이 매우 떨어진다. 단순히 예약된 회의의 목록만 표시되기 때문에, 방 별로 비어 있는 시간이 언제인지를 확인하기가 힘든 것이다. 당신은 이를 직접 해결해 보기로 마음 먹었다. 회의실 이용 규칙은 다음과 같다: - 회의실은 9시부터 18시까지만 사용 가능하다. 모든 회의의 시간은 이 안에 완전히 포함되어야 한다. - 회의는 정확히 한 회의실을 연속한 일정 시간 동안만 점유한다. 즉 각 회의는 (회의실, 시작 시각, 종료 시각)의 정보로 나타낼 수 있다. - 회의의 시작과 종료 시각은 시(時, hour) 단위로만 설정 가능하다. 같은 회의실을 .. Softeer, [21년 재직자 대회 예선] 전광판 풀이 문제 현대차그룹에 다니는 당신은 전세계 유가 변동에 대해 실시간으로 파악하기 위해 사무실에 유가를 실시간으로 표시하는 전광판을 설치하였다. 전광판은 최대 다섯 자리의 자연수만을 표시할 수 있도록, 아래와 같이 육각형 모양의 전구 7×5=35개로 구성되어 있다. 8자 모양의 전구 묶음은 0부터 9까지의 숫자를 표현할 수 있으며, 표현 방법은 아래와 같다. 아래 그림에서 전구가 켜졌으면 검정색, 꺼졌으면 옅은 회색으로 표현되었다. 예를 들어, 전광판을 통해 9881를 표현하면 아래와 같다. 만의 자리 수가 없기 때문에, 만의 자리에 해당하는 전구들이 모두 꺼져 있음에 유의하라. 예를 들어, 전광판을 통해 10724를 표현하면 아래와 같다. 각각의 전구에는 스위치가 달려 있다. 전구에 달려 있는 스위치를 누를.. 주식투자 파이썬으로 해보자_금융데이터 수집하기#1 "주식투자 파이썬으로 해보자" 첫 번째 글입니다. (이 글은 이현열님의 'R을 이용한 퀀트 투자 포트폴리오 만들기'를 참고하여 작성하였습니다. 감사합니다) 요리하기 전에는 시장에 가서 재료를 사와야 하듯, 금융데이터를 분석하기 위해서는 재료인 데이터들을 구해야합니다. 파이썬으로 웹상에 있는 금융데이터를 수집하는 코드를 먼저 작성해서 기본 재료를 준비해보겠습니다. #STEP 0, KRX 정보데이터시스템 탐색 데이터를 가져올 사이트는 KRX 정보데이터시스템(data.krx.co.kr)입니다. 정보시스템의 [통계] > [기본통계] > [주식] > [세부안내] 중 아래 두 가지 데이터를 사용하려 합니다. [12025] 업종분류 현황 [12021] PER/PBR/배당수익률(개별종목) 목표 데이터 사이트에는 다운로.. 이전 1 다음