Python base study 4

web crawling (웹 크롤링) 크롤링 전 알고 가야 할 지식 2

1. HTML (Hyper Text Markup Language) 웹 페이지를 만들기 위해 사용되는 프로그래밍 언어이다. HTML은 일종의 태그(tag)를 이용하여 문서의 구조를 정의한다. 예를 들어 태그는 문서 전체를 감싸는 태그이며, 태그는 문서의 제목이나 스타일 시트와 같은 정보를 담고 있는 태그이고, 태그는 실제 내용을 담는 태그이다. 태그는 다른 태그를 포함 할 수도 있는데, 태그는 웹 페이지의 특정 부분을 지정하는 사용되며, 태그 안에 다른 태그들을 넣어 해당 부분을 자세히 정의 할 수 있다. HTML은 또한 링크, 이미지, 비디오 등과 같은 다양한 미디어를 웹 페이지에 포함시킬 수 있다. 이러한 미디어들은 각각 태그를 사용하여 웹 페이지에 삽입된다. 2.CSS (Cascading Style ..

Python base study 2023.03.24

web crawling (웹 크롤링) 크롤링 전 알고 가야 할 지식 1

1. 웹 크롤링 정의 웹 크롤링은 필요한 데이터가 있는 웹페이지에서 원하는 정보를 가져오는 것을 말한다. 더 알아봐야 그저 난잡한 글이 될 것으로 예상. 크롤링을 하면서 주의할 점이 몇가지 있는데 첫번째로, 크롤링 하려고 하는 웹 서버에 원하는 데이터를 요청하는 방식으로 크롤링을 하게 될 텐데 이런 요청이 늘어날수록 상대방 서버에 걸리는 부하가 커지므로 과부하를 만들어 피해를 입히지 않도록 주의해야 한다. 그리고 두번째로, 크롤링한 데이터를 무분별하게 상업적으로 이용하면 심각한 문제를 발생 시킬 수 있으므로 주의해야 한다. 2. 웹의 기본적인 구조 기본적으로 웹은 요청에 의한 응답 형식으로 이루어져 있다. 클라이언트가 어떠한 메서드를 이용해 요청을 하면 그에 응답하는 방식으로 동작한다. 응답하는 방식은 ..

Python base study 2023.03.24

Python 기본 문법 정리 2

1. bool 형 참(True)과 거짓(False)의 형식으로 이루어진 형태이다. 주로 if 문을 이용한 조건문 형식에서 자주 쓰이고 그 이외의 형태에서도 이용 할 수 있다. 참과 거짓의 형태는 단순한 두가지 방식으로만 나타나지만 이 두가지 형식을 나타내기 위해서는 여러가지 방법을 이용할 수 있다. 기본적으로 조건문에서 bool 형을 확인 할 수 있는데 기본적으로는 값이 같을 경우 True 틀릴경우 False의 값을 나타낸다. 예를 들면 다음과 같다. a == a True a == b False 위에 나타나는 형식 이외에도, 곧 아래에 이야기 할 list 형의나 tuple형식에서 값이 있고 없고에 따라 참과 거짓이 나뉘기도 한다. 문자열이나 리스트 튜플 딕셔너리 등의 값이 비어있으면 거짓(False)이 ..

Python base study 2023.03.03

Python 기본 문법 정리 1

변수 값에 어떠한 값(value)을 담아 사용하는데 이 값을 자료형(data type) 또는 타입(type)이라고 한다. 변수에 저장된 값(value) 에는 해당하는 타입(type) 값이 할당되게 되는데 타입(type) 의 종류는 다음과 같다. 각각 간단하게 주석을 달자면 아래처럼 말 할 수 있다. int -> 정수형 float -> 실수형 string -> 문자형 complex -> 허수형 bool -> Ture / False 형 tuple -> 고정 데이터형 list -> 리스트형 dict -> 딕셔너리형 NoneType -> 논타입형 function -> 펑션형 변수에 저장된 값(value)의 타입(tpye)이 어떤 것인지에 따라 변수의 타입(type)이 결정된다. 하나 하나 간단히 타입값을 알아보..

Python base study 2023.02.21