실무관련

실무관련

[Linux] 명령어 - 7일이내 변경된 파일 찾기

find ./* -type f -mtime -7 👉 find : 파일이나 디렉토리 검색하는 명령어 👉 ./ : 현재 디렉토리 👉 * : 현재 디렉토리의 모든 파일과 디렉토리를 대상 👉 -type f :검색 대상을 파일로 제한 (-type d : 디렉토리 검색) 👉 -mtime -7 : 수정된 시간을 기준으로 7일 이내

실무관련

[ SOLR ] 검색어 맞춤 검색 방법

이전 게시글에서부터 해왔던 solr 작업이 조금 보완이 필요했다. solr 에서 쿼리로 데이터를 조회할 때 해당 검색어에 대한 검색이 필요했던 요구사항이었다. 사실 여러 방법이 많았지만 정리를 좀 해보려고 한다. ① fieldType 을 String 으로 변경한다. fieldType 이 String 일 경우 문자열로 받아들여 문자열 검색이 된다. 이 때는 형태소 분석이 되지않는 것으로 알고있다. 하지만 나같은 경우는 contents 값이 String 으로 들어가버리면 검색 자체가 안되기 때문에 사용하지 못했다. ② fieldType 을 text_ko_no_analysis 로 변경한다. fieldType 을 새로 만들면 되는데, 형태소 분석을 하지않는 fieldType 으로 생성하게되면 형태소 분석을 거치..

실무관련

[ SOLR ] 형태소 분석

드디어 솔라 관련 추가 개발이 마무리되었다. 사실 큰 개발건도 아니었지만 개발하면서 검색엔진에 대해 조금은 공부해 볼 수 있었던 기회같았다. 0. 생각 정리 내가 해야하는 개발은 검색어를 형태소 분석을 하지않고 검색어 전체를 이용한 검색이 가능하도록 구현하는 것이었다. 기본적으로 SOLR 는 Schema.xml 파일이나 conf 설정을 따로 가지고있었다. field 를 따로 생성하고 그 field 별로 fieldType 을 설정해주면 해당 타입에 맞게 규칙들이 적용된다고 생각하면 쉬울 것 같다. 1. 방법 정리 형태소 분석을 하려면 "text_ko" 라는 타입을 사용하면되는데 , 이렇게 fieldType name 을 "text_ko" 로 주고 filter 를 이용해서 원하는 규칙들을 설정할 수 있다. 하..

실무관련

[ SOLR ] 솔라 검색 역색인 (Inverted Index)

앞서 작성되어있듯이 검색엔진은 역색인 방식을 통하여 검색 성능을 향상시킨다. 이번에는 역색인 방식에 대해 알아보았다. 0. 역색인이란? 주어진 키워드에 대해서 해당 키워드가 포함된 데이터의 위치를 추적해내는 것 우리가 검색하고자 하는 검색어를 입력하면 역색인은 검색어에 대해 요청이 들어왔을 때 해당 검색어들을 포함하고 있는 데이터들을 찾아내는 것을 의미한다. ✅ 색인 : 책 맨 앞의 목차 ✅ 역색인 : 책 맨 뒷 부분의 색인 * 검색엔진에서 각 문장의 단어 (term, token) 을 분리하고 정렬한 다음, 어느 document 에 있는지 표시하는 방식을 통해 Inverted Index 를 활용하고 이를 통해 검색 성능을 향상시킨다고 한다. 1. 검색엔진에서의 역색인 검색엔진은 검색어 입력 후 검색어에 ..

실무관련

[ DB ] 관계형 데이터베이스 RDBMS

솔라에 대해 알아보다보니 기초 지식들에 대한 정리도 다시한번 필요함을 느꼈다. 0. 관계형 데이터베이스란? 관계형 데이터베이스는 9070년대에 IBM 에서 일하던 에드거 F.커드가 제안한 데이터베이스 모델이다. 데이터를 테이블 형태로 저장하고 행(row), 열(column) 에 저장되는 형식이다. 1. 관련 용어 정리 용어를 간단하게 정리해보자면, ✅ column 열 : 필드라고도 부르며 항복의 속성을 나타낸다. ✅ row 행 : 레코드 라고도 부르며 데이터 항목을 저장한다. ✅ schema 스키마 : 제약사항을 스키마라고 부른다. (ex : not null) 2. 관계형 데이터베이스의 관계 테이블간의 관계는 1:1 / 1:N / N:N 의 관계가 있다. 기본키 primary key 와 외래키 forei..

실무관련

[ SOLR ] 솔라 검색

회사에서 업무를 하던 도중 고객사에서 솔라 관련 문의가 들어왔다. 문의사항은 검색엔진에서의 검색 방식에 대한 문의였고 수정이 가능할 것 같아 분석하던 도중 ... 사실 검색엔진인 솔라에 대해 자세하게 들여다본적이 없었기에 차근차근 공부를 하면서 분석을 시작하려고 한다. 문의사항에 대한 분석은 완료하였고 어떻게 수정하면 최적의 방식으로 수정 가능한지 생각 중에 있다. 0. SOLR 검색엔진이란? Solr 검색엔진은 오픈소스 기반의 검색 플랫폼이다. 루씬의 자바 검색라이브러리를 사용하여 full-text 인덱싱과 검색을 지원한다고 한다. 사실 관계형 데이터베이스 (RDBMS) 를 통해 원하는 데이터 검색을 충분히 할 수 있지만 , 그럼에도 검색엔진이 필요한 이유가 존재한다. ( RDBMS 에 대한 간략한 설..

공또뤼
'실무관련' 카테고리의 글 목록