관리 메뉴

SW

Beautifulsoup 본문

대학교/Data

Beautifulsoup

SWKo 2020. 1. 30. 19:58
practice
In [73]:
from IPython.core.display import display, HTML
display(HTML("<style> .container{width:90% !important;}</style>"))
In [33]:
# 서버에 접속해서 데이터를 가져오는 모듈
!pip3 install requests
Requirement already satisfied: requests in /Library/Frameworks/Python.framework/Versions/3.8/lib/python3.8/site-packages (2.22.0)
Requirement already satisfied: urllib3!=1.25.0,!=1.25.1,<1.26,>=1.21.1 in /Library/Frameworks/Python.framework/Versions/3.8/lib/python3.8/site-packages (from requests) (1.25.7)
Requirement already satisfied: chardet<3.1.0,>=3.0.2 in /Library/Frameworks/Python.framework/Versions/3.8/lib/python3.8/site-packages (from requests) (3.0.4)
Requirement already satisfied: idna<2.9,>=2.5 in /Library/Frameworks/Python.framework/Versions/3.8/lib/python3.8/site-packages (from requests) (2.8)
Requirement already satisfied: certifi>=2017.4.17 in /Library/Frameworks/Python.framework/Versions/3.8/lib/python3.8/site-packages (from requests) (2019.11.28)
In [41]:
# 서버에서 가져온 데이터를 html형식으로 변경
!pip3 install beautifulsoup4
Requirement already satisfied: beautifulsoup4 in /Library/Frameworks/Python.framework/Versions/3.8/lib/python3.8/site-packages (4.8.2)
Requirement already satisfied: soupsieve>=1.2 in /Library/Frameworks/Python.framework/Versions/3.8/lib/python3.8/site-packages (from beautifulsoup4) (1.9.5)
In [48]:
!pip install beautifulsoup4
WARNING: pip is being invoked by an old script wrapper. This will fail in a future version of pip.
Please see https://github.com/pypa/pip/issues/5599 for advice on fixing the underlying issue.
To avoid this problem you can invoke Python with '-m pip' instead of running pip directly.
Requirement already satisfied: beautifulsoup4 in /Users/kosangwon/.conda/envs/practice2/lib/python3.7/site-packages (4.8.2)
Requirement already satisfied: soupsieve>=1.2 in /Users/kosangwon/.conda/envs/practice2/lib/python3.7/site-packages (from beautifulsoup4) (1.9.5)
In [56]:
# 1. 네이버에 접속해서 소스코드를 가져온다.
# 1-1. 접속하려면 requests 필요하다.
import requests
from bs4 import BeautifulSoup
url = "https://www.naver.com/"
req = requests.get(url) #접속해서 받아온 데이터, 접속 코드 등
if req.status_code == requests.codes.ok:
    print("접속 성공")
    # 다음에 할일들
    # print(req.text)
    # 서버에서 받아온 데이터는 text 형태이다.
    # html 형태로 파싱(parsing)한다.
    html = BeautifulSoup(req.text, "html.parser") # bs4 이용
    span_tags = html.select('span') # span태그들을 span_tags에 넣음
    for tag in span_tags:
        print(tag.text) # text만 추출해서 출력
    #html.select_one()
else:
    print("접속실패")
# 2. 소스코드를 해석해서 실시간 급등 검색어 들을 가져온다.
# 3. 검색어를 화면에 출력한다.
접속 성공
연합뉴스 바로가기
주제별캐스트 바로가기
타임스퀘어 바로가기
쇼핑캐스트 바로가기
로그인 바로가기
NAVER Whale

다운로드
닫기
네이버


쥬니어네이버

해피빈




자동완성 펼치기

검색

한글 입력기


시간대와 관심사에 맞춘 컨텍스트 자동완성
도움말 보기

시간대와 관심사에 맞춘 컨텍스트 자동완성
도움말 보기

ON선택됨
OFF

선택됨
도움말신고

검색어저장 켜기자동완성 끄기

기능을 다시 켤 때는 자동완성 펼치기을 클릭하세요
도움말신고

검색어저장 켜기자동완성 끄기

기능을 다시 켤 때는 자동완성 펼치기을 클릭하세요
도움말신고

검색어저장 켜기자동완성 끄기

기능을 다시 켤 때는 자동완성 펼치기을 클릭하세요
도움말신고

검색어저장 켜기자동완성 켜기

@in_txt@
내 검색어 등록
알림
기록 삭제
검색어저장 끄기자동완성 끄기

기록 전체 삭제
완료
기록 전체 삭제
검색어저장 끄기자동완성 끄기

기능을 다시 켤 때는 자동완성 펼치기을 클릭하세요




메일

카페

블로그

지식인

쇼핑

네이버페이

네이버TV

사전

뉴스

증권(금융)

부동산

지도

영화

뮤직

책

만화 / 웹툰





더보기
더보기





이미지형
리스트형
설정
이전 페이지
다음 페이지
언론사 목록
언론사 목록
종합/경제

방송/통신

IT

영자지

스포츠/연예

매거진/전문지

지역

NAVER Sign in
Forgot Username or Password?
01.29.
(수)
앞의 목록으로 이동
뒤의 목록으로 이동
이전 주제

다음 주제

전체 주제 열기

전체 주제 목록 닫기






오늘 많이 힘들었냥?
퇴근 후 지친 집사를 반기는 '폭풍 그루밍'

오늘 많이 힘들었냥?
퇴근 후 지친 집사를 반기는 '폭풍 그루밍'







'함께 할래옹~?!' 동그람이에서 새 동료를 찾습니다

'함께 할래옹~?!' 동그람이에서 새 동료를 찾습니다

채용 공고

~2/6

채용 공고

~2/6






편의점만 다녀와도 반기는 강아지, 사실은?

편의점만 다녀와도 반기는 강아지, 사실은?
AD

베이컨박스

베이컨박스






유기견에게 닭뼈 먹이고, 얼어 죽게 방치한 BJ 논란

유기견에게 닭뼈 먹이고, 얼어 죽게 방치한 BJ 논란

국내 동물 이슈

국내 동물 이슈



웹툰


웹툰
웹툰


유기견 임시보호에 한마음 한뜻으로 뭉친 제주 이웃들

유기견 임시보호에 한마음 한뜻으로 뭉친 제주 이웃들

노견일기by 올드독

노견일기by 올드독






오줌에서 '버터 팝콘' 향이 나는 희귀 고양이의 정체

오줌에서 '버터 팝콘' 향이 나는 희귀 고양이의 정체

애니팩트

신기한 동물사전

애니팩트

신기한 동물사전






둠칫둠칫~ '아무노래'에 몸을 맡긴 멍냥이들(ft.크러쉬)

둠칫둠칫~ '아무노래'에 몸을 맡긴 멍냥이들(ft.크러쉬)

SNS 핵인싸 따라잡기

SNS 핵인싸 따라잡기






'밀려오는 자책감' 탯줄 달린 아깽이를 돌본다는 것

'밀려오는 자책감' 탯줄 달린 아깽이를 돌본다는 것

동물이 행복한 세상

동물이 행복한 세상






'애들 건너잖아!' 무개념 운전자 혼쭐 낸 떠돌이 견공

'애들 건너잖아!' 무개념 운전자 혼쭐 낸 떠돌이 견공

해외 동물 이야기

해외 동물 이야기






이젠 아프지마...17년 함께한 반려견과 이별한 조권

이젠 아프지마...17년 함께한 반려견과 이별한 조권

동물과 사람 이야기

동물과 사람 이야기






동물원 '판다'를 만나기 위해 내는 '임대료'의 진실

동물원 '판다'를 만나기 위해 내는 '임대료'의 진실

글로벌 반려통신

오스트리아

글로벌 반려통신

오스트리아






우한 폐렴 확산, 길고양이에 불똥? 수의사 답변 들어보니

우한 폐렴 확산, 길고양이에 불똥? 수의사 답변 들어보니

동물 뉴스

동물 뉴스






어미와 생이별하고 동물병원에 버려진 아깽이 남매

어미와 생이별하고 동물병원에 버려진 아깽이 남매

가족이 되어주세요

가족이 되어주세요






원숭이야, 곰이야? 긴 혀로 꿀 파먹는 너구리 '킨카주'

원숭이야, 곰이야? 긴 혀로 꿀 파먹는 너구리 '킨카주'

세상의 모든 동물

세상의 모든 동물

네이버 프로젝트 꽃
매주 꾸준히 그라폴리오하다스타 일러스트레이터가 되다

헬로!아티스트
미술을 순례하는한국적 앵포르멜

프로젝트 꽃
네이버웨일















In [65]:
#BMI - 체중(kg)을 키(m)의 제곱으로 나누면
# 1. 체중을 입력 받는다.
weight = float(input("체중 : "))
# 2. 키를 입력 받는다.
height = float(input("키 : "))
# 3. bmi를 계산한다.
bmi = weight / ((height/100)**2)
# 4. bmi를 출력한다.
print(bmi)

if bmi < 18.5:
    print("저체중")
elif bmi < 23:
    print("정상체중")
else:
    print("과체중")
    
# 오류의 종류
# 1. 문법 오류
# 전체 오류 80%
# 2. 런타임 오류
# 3. 논리 오류
체중 : 73
키 : 178
23.04002019946976
과체중
In [72]:
movie1_name=input('영화 제목을 검색하시오 : ')
import requests #소스코드를 가져오기위해 requests라는 라이브러리를 이용ㅎ나다.
from bs4 import BeautifulSoup #소스코드를 가져오면 데이터가text형식이라 이걸 html로 바꿔줘야한다,
url="https://search.naver.com/search.naver?sm=tab_hty.top&where=nexearch&query=" + movie1_name
req = requests.get(url) #영화url을 가져오고 그 url안의 페이지소스를 req변수에 저장한다

if req.status_code == requests.codes.ok: #변수를 잘 가져왔다면성공
    print("접속 성공")
    html = BeautifulSoup(req.text,"html.parser") #가져온 데이터를 html형식으로 바꾼다,
    span_tags=html.select('a._sp_each_title')  #가져온 데이터 안에서 title이라고 태그가 달려있는것을 가져와서 변수에 저장한다
    for tag in span_tags: #title태그를 가진 애들의 개수만큼 
        print(tag.text) #그 내용을 다 출력한다.
else:
    print("접속 실패")
영화 제목을 검색하시오 : 시동
접속 성공
영화 시동 - 웃기지도 진지하지도 않은 애매함
영화 <시동> 후기, 연말연초에 누구와 봐도 편하게 즐길 수 있는...
영화 시동 후기, 마동석 실망스러울 줄 알았는데....
영화 시동 극장에서 봤더니 원작 웹툰과 다른 감동과 웃음에...
팰리세이드 전복 시동꺼짐 사고로 스포티지R로 후진시 시동이...
KT&G, PMI와 협력관계 구축...전자담배 '릴(lil)' 글로벌시장 진출 시동
젝스키스, 콘서트 스팟 영상 공개…'ACCESS' 시동
광주, 3939억 투입 'AI 생태계 구축' 시동
성공 여부 안 따지는 혁신 R&D ‘알키미스트 프로젝트’ 2탄 시동
In [ ]:
 

'대학교 > Data' 카테고리의 다른 글

matplotlib  (0) 2020.02.01
Kaggle [Titanic Data Analysis]  (0) 2020.02.01
json  (0) 2020.01.30
pandas  (0) 2020.01.30
openpyxl  (0) 2020.01.30
Comments