본문 바로가기

분류 전체보기

(11)
데이터분석_Logistic Regression(로지스틱회귀) 로지스틱 회귀란 무엇인가 로지스틱 회귀(Logistic Regression)는 회귀를 사용하여 데이터가 어떤 범주에 속할 확률을 0에서 1 사이의 값으로 예측하고 그 확률에 따라 가능성이 더 높은 범주에 속하는 것으로 분류해주는 지도 학습 알고리즘이다. 스팸 메일 분류기 같은 예시를 생각하면 쉽다. 어떤 메일을 받았을 때 그것이 스팸일 확률이 0.5 이상이면 spam으로 분류하고, 확률이 0.5보다 작은 경우 ham으로 분류하는 거다. 이렇게 데이터가 2개의 범주 중 하나에 속하도록 결정하는 것을 2진 분류(binary classification)라고 한다. 로지스틱 회귀를 이해하려면 우선 선형 회귀(Linear Regression)에 대한 개념을 먼저 익혀야 한다. 상세한 내용은 링크를 타고 가시면 정..
주식투자 파이썬으로 해보자_금융데이터 수집하기#2 "주식투자 파이썬으로 해보자" 두 번째 글입니다. 지난 글(https://makes-sense.tistory.com/2?category=958178)에 이어서 종목별 상세 데이터를 가져오는 방법을 소개해드리겠습니다. #STEP 5, PER/PBR/배당수익률(개별종목) 데이터 가져오기 방식은 앞선 글에서 했던 방식과 동일한 방식을 사용합니다. 먼저 우리가 데이터를 가져올 사이트를 파보겠습니다. KRX 정보데이터시스템(data.krx.co.kr)에서 정보시스템의 [통계] > [기본통계] > [주식] > [세부안내] 중 [12021] PER/PBR/배당수익률(개별종목) 으로 들어가면 아래와 같은 화면이 나옵니다. 페이지 접속 후 F12(개발자 도구화면)을 열고 다운로드 버튼을 클릭한 후 "CSV"를 눌러줍니다..
블라인드_기업리뷰 크롤링 크롬드라이브를 활용한 블라인드 기업리뷰 크롤링 코드입니다. 코드 작동하면 크롬이 뜨고 웹로그인 인증 후에 자동으로 기업리뷰 내용을 가져옵니다. from selenium import webdriver from selenium.webdriver.common.by import By import time import pandas as pd import re #https://www.teamblind.com/kr/ 에 접속 하여 기업리뷰 클릭 > 회사명 검색 회사명 클릭 후 리뷰의 상단 URL URL = "https://www.teamblind.com/kr/company/###/reviews" #위의 URL의 페이지의 > 버튼 클릭 후 마지막 페이지 번호 입력 lastPage =25 #이후 파일 실행 시 크롬브라우..
Jobplanet 기업리뷰 크롤링코드 잡플래닛에 있는 기업별 리뷰페이지들을 크롤링해서 엑셀로 만들어주는 코드입니다. import requests from bs4 import BeautifulSoup import pandas as pd import re login_url = 'https://www.jobplanet.co.kr/users/sign_in' #email 본인 아이디, password 본인 패스워드 입력 단, 리뷰를 남겨서 전체 접근이 가능한 상태여야함 email = '###' password = '###' LOGIN_INFO ={ 'user[email]' : email, 'user[password]' : password, 'commit' : '로그인' } session = requests.session() res = session...
People Analytics 분석환경에 대해 https://hr.wanted.co.kr/insights/balance/ People Analytics 101 8편 : 균형 | HR커뮤니티 인살롱 몇 년 전만해도 의료계를 뜨겁게 달구던 인공지능 의사 왓슨이 시장에서 사라졌다. 처음 왓슨이 국내에 도입될 당시에는 의사를 대체하게 될 것이라는 의견도 있었으나 환자의 건강에 주는 이 hr.wanted.co.kr 위 링크 강지상님이 쓰신 아티클에서 이야기한 것처럼 People Analytics라는 일은 HR과 Analytics 사이에서 균형과 조화를 맞추고 커뮤니케이션 하는 역할이라고 볼 수 있을 것 같다. "HR이라는 땅을 떠나 Analytics라는 이상만을 좇는 것은 아닌지 항상 곱씹어 보길 바란다."라는 문구에 크게 공감했다. 실무에서 People A..
Softeer, [21년 재직자 대회 예선] 회의실 예약 문제 회사에는 N개의 회의실이 있다. 수많은 팀이 모여 토론하고 업무를 처리하기 위해서는 회의실이 필수적이다. 내부망에 아주 간단한 회의실 예약 시스템이 있지만 편의성이 매우 떨어진다. 단순히 예약된 회의의 목록만 표시되기 때문에, 방 별로 비어 있는 시간이 언제인지를 확인하기가 힘든 것이다. 당신은 이를 직접 해결해 보기로 마음 먹었다. 회의실 이용 규칙은 다음과 같다: - 회의실은 9시부터 18시까지만 사용 가능하다. 모든 회의의 시간은 이 안에 완전히 포함되어야 한다. - 회의는 정확히 한 회의실을 연속한 일정 시간 동안만 점유한다. 즉 각 회의는 (회의실, 시작 시각, 종료 시각)의 정보로 나타낼 수 있다. - 회의의 시작과 종료 시각은 시(時, hour) 단위로만 설정 가능하다. 같은 회의실을 ..
HR Digital Transformation이란? 1. HR Digital Transformation이란 디지털 혁신이란? Digitization: 아날로그에서 디지털로의 변화을 의미 (ex. 각종 종이 기반의 문서를 디지털 기반의 문서 파일로 변경) Digitalization: 업무를 간소화 하기 위하여 디지털 데이터를 활용하는 것을 의미 (ex. 콜센터에서 고객 대응 시 신속하게 이전 요청 사항을 검색 확인) Digital Transformation: 모든 고객과의 상호 작용에 있어서 가치를 증대시키는 행위를 의미 (ex. 고객의 관람 데이터를 활용하여 고객 경험 증대를 통한 매출 증대) "단순한 디지털화에 대한 것이 아닌, 일상적인 활동에서 발생되는 데이터를 기반으로 고객의 가치를 증대시키는 것" HR DT에서 가장 중요한 것은 직원의 경험을 어떻..
Softeer, [21년 재직자 대회 예선] 전광판 풀이 문제 현대차그룹에 다니는 당신은 전세계 유가 변동에 대해 실시간으로 파악하기 위해 사무실에 유가를 실시간으로 표시하는 전광판을 설치하였다. 전광판은 최대 다섯 자리의 자연수만을 표시할 수 있도록, 아래와 같이 육각형 모양의 전구 7×5=35개로 구성되어 있다. 8자 모양의 전구 묶음은 0부터 9까지의 숫자를 표현할 수 있으며, 표현 방법은 아래와 같다. 아래 그림에서 전구가 켜졌으면 검정색, 꺼졌으면 옅은 회색으로 표현되었다. 예를 들어, 전광판을 통해 9881를 표현하면 아래와 같다. 만의 자리 수가 없기 때문에, 만의 자리에 해당하는 전구들이 모두 꺼져 있음에 유의하라. 예를 들어, 전광판을 통해 10724를 표현하면 아래와 같다. 각각의 전구에는 스위치가 달려 있다. 전구에 달려 있는 스위치를 누를..