전체 글

becoming the data engineer
Image 다루기 Gitpage를 운영하다보니 Card 이미지에 나오는 이미지 크기를 균일하게 다룰 필요가 있어 찾아본 방법 Library python3 기준 pip install Pillow Pillow 내 PIL library를 이용 할 것이다. How to import glob # file List imglist = glob.glob("D:/GithubPages/images/*.png") img = Image.open(imglist[0]) print(img.size) # (400,250) tuple 형태로 출력. 즉, 나중에 Resizing 을 할때도 Tuple로 입력. img.show() # 이미지 확인 img.resize((100,10)).show() # Resizing 이후 다시 확인 for ..
· STUDY/ETC
클라우드 개발을 위한 가상화와 Docker 1 Credu (회사 내 이러닝) 을 통한 학습. 1. 클라우드의 개념 및 종류 SPI 모델 가장 일반적인 클라우드 구분법 IaaS (Infrastructure as a Service) 서버 자원 (CPU/메모리/디스크 등) - 순수 하드웨어만 가상화하여 제공 예) 아마존 AWS EC2 PaaS (Platform as a Service) OS + Runtime(Java) + Platform(Spring, Hadoop) 아마존 AWS EMR SaaS (Software as a Service) Google Drive, MSOffice.com 클라우드 구축하기 위한 요소기술 (Enabling Technology)에 가상화기술과 도커와 같은 컨테이너기반 기술이 있다. ..
4.Quick_Sort.md 퀵정렬분할 정복가장 간단한 경우로 기본 단계를 찾는다.주어진 문제를 작게 줄여서 기본 단계가 되도록 만드는 방법을 찾는다.예 (덧셈 함수)[1,2,3,4] xxxxxxxxxxdef sum(arr): total = 0 for x in arr: total += x return total print(sum([1,2,3,4]))1단계 : 기본 단계를 찾는다. 가장 간단한 경우는 배열의 원소 개수가 0개 또는 1개인 배열을 받으면 합계를 구하는 것.2단계 : 재귀 함수 호출을 할 때마다 호출 대상이 되는 배열의 크기가 점점 감소시켜야 한다. 결론 리스트를 받으면 크기를 구해 비어있으면 0을 반환 그렇지 않으면 총합은 리스트의 첫 번째 숫자와 나머지 리스트의 총합을 더한 값이 된다.퀵 ..
실전 주식 분석 facebook stock : https://finance.yahoo.com/quote/FB?p=FB Historical data -> 5years -> apply -> download data ch06 table.csv 이용. input { file { path => "/home/ubuntu/workspace/elasticsearch/ch06/table.csv" # file path start_position => "beginning" # csv 파일을 처음부터 입력. sincedb_path => "/dev/null" } } filter { csv { separator => "," columns => ["Date","Open","High","Low","Close","Volume","Ad..
실전 인구 분석 Dataset : http://catalog.data.gov/dataset Population by country download (github ch06) Kibana & Elasitcsearch 가 돌아가나 확인 ps -ef | grep Logstash (이전에 설치 했어서 설치하지 않았다.) 동일 실습에서 동일 서버에 필요하므로 신규로 설치 wget https://artifacts.elastic.co/downloads/logstash/logstash-5.1.2.tar.gz 압축을 풀고 ch06에 있는 logstash.conf 파일 내 PATH를 수정하고 logstash폴더 내 conf 폴더 생성 후 해당 폴더로 복사 Logstash.conf input { file { path => "..
KIBANA 기초 해당 자료는 Inflearn.com의 ELK 무료 강좌를 기반으로 정리한 자료 입니다. 준비(Management) Elastic Search에 먼저 Document를 먼저 넣도록 한다. curl -XDELETE localhost:9200/basketball curl -XPUT localhost:9200/basketball (document생성) curl -XPUT 'localhost:9200/basketball/record/_mapping' -d @basketball_mapping.json curl -XPOST 'localhost:9200/_bulk' --data-binary @bulk_basketball.json Kibana Start & go to web page (IP:5601(p..
Elasticsearch 기초 해당 자료는 Inflearn.com의 ELK 무료 강좌를 기반으로 정리한 자료 입니다. ElasticSearch 기본 개념 위의 그림은 ElasticSearch의 기본 인덱싱 및 검색처리를 위한 저장 방식이다. 일반적인 RDB와 Indexing 방법이 차이가 있는데, 이를 역인덱싱 방식이라고 한다. Elasticsearch Structure 기본 구조는 아래와 같은데 이를 RDB와 비교해서 이해하면 쉽게 이해 할 수 있을 것이다. Elastic Search vs RDB CRUD curl -XGET http://localhost:9200/classes(클래스명)?pretty 하면 결과가 이쁘게 나온다. 여기서 Pretty 없다면 결과가 보기가 힘들게 나온다. status 가 ..
· STUDY/ETC
티스토리 블로그에 Markdown 적용하기. 깃허브와 깃허브 페이지를 동시에 적용하고 있는 시점에서 티스토리도 같은 내용을 동일한 내용을 적용해보고자 찾아보게 되었습니다. Markdown의 장점 편하게 에디터를 통해 문서를 작성할 수 있으며, 그 모양 또한 이쁘게 나온다. 그림과 링크, 테이블 등 간단히 문서 정리를 할 수 있는 기능이 많다. 소스코드 또한 해당 코드 문법에 맞도록 처리해서 공유가 가능하다. 가장 큰 장점은 하나만 작성하고 3군데 다 업로드가 가능하다는 것이다. 현재 사용하는 에디터 typora 라는 어플인데 맥에서 사용 중. Typora 실시간으로 View로 볼 수 있어 좋다. 적용 Tistory HTML/CSS 속성에 Markdown css 적용이 필요. Markdown CSS 해당 ..
3.Recursive_function.md 재귀함수 (Recursive function)재귀할머니의 비밀상자가 존재한다. 상자를 열어보니 또 안에 많은 상자가 존재한다. 그 중 하나에 키가 있다고 한다면...첫번째 (While)내부를 확인할 상자를 쌓아놓는다.상자를 하나 집어서 내부를 살핀다.만약 안에 상자가 있다면 꺼내어 나중에 확인할 상자 더미에 놓는다.만약 열쇠가 있으면 작업 종료.반복한다. xxxxxxxxxxdef look_for_key(main_box): pile = main_box.make_a_pile_to_look_through() while pile in not empty: box = pile.grab_a_box(): for item in box: if item.is_a_box(): pil..
ELK 설치 (Elasticsearch, Logstash, Kibana) 회사에서 실시간 로그 관리 시스템 구축 프로토 타입으로 인해 설치를 수행하면서 적용했던 방법을 공유하고자 작성하였습니다. Apache web server -> Logstash -> Elasticsearch -> kibana ElasticSearch JSON Format으로. RESTfull 방식의 분산 검색 엔진. Apache Lucene을 바탕으로 하고 있으며, 대량의 데이터보단 크지 않은 데이터를 보관하는 역방향 인덱싱 DB 시스템이라고 생각할 수 도 있다고 한다. Logstash 로그 수집기 Web apache server log file 또는 다양한 시스템의 LogFile을 수집하여 전송하는 수집기. Kibana BI 툴 E..
J_Today
2DH