달력

5

« 2024/5 »

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31

http://suite.tistory.com/ fs

FULL TEXT RETRIEVAL   ~.~

 

:
Posted by mastar

http://suite.tistory.com/ 2008 .4  fs

sed => stream editor~~~~


, -> \n 으로 변경할때


ex)  sed s/,/\\n/g xad >aaa


근데 이게왜  vi에서는 안된다 ~.~

 

:
Posted by mastar

http://suite.tistory.com/ fs

공통점이라면 세가지 모두 데이터 전송
그리고 ssh 에 자동 로긴을 해두면 데이터 전송시 암호를 입력하지 않아도 된다.


차이라면  

- scp 는  우리가 기존에 쓰던 cp 처럼 source 와 target 실행시 지정해야하고 그리고 recurive하게 하위 디렉토리도 가능하다

-  sftp는 ftp처럼 디렉토리 이동하면서 사용할수있고

- rsync 는 그냥 싱크 즉 미러링 관련 옵션이 많다. 서로 호스간에 있는거 없는거 지울거 링크파일 보존 관련된 옵션이 많다.

          

쓰고나니 당연한거군  ㅋㅋ



추가 : scp로 심볼릭 링크 파일 복사시

1. 타겟 디렉토리에 링크할 파일이 없을때

   => 원본에서 링크한 파일을 복사해서 일반파일이 됨

2. 타겟 디렉토리에 존재할때

   => 링크파일은 자체는 보존 하지만 원격지 링크 파일이 링크한 파일이 덮어서 복사 된다.???? <- 직접 해보기바람

 

'용-ILE > 잡다구리' 카테고리의 다른 글

지금 하는건 ~ FTR : Full Text Retrieval  (0) 2008.05.15
[sed] 개행문자 추가 ~~ line feed 엔터값  (1) 2008.05.15
IP 특허 약자는~~  (0) 2008.05.15
5개월 프로젝트 마무리중~~  (0) 2008.05.15
감리시 문서 작성  (0) 2008.05.15
:
Posted by mastar
2008. 5. 15. 19:28

IP 특허 약자는~~ 용-ILE/잡다구리2008. 5. 15. 19:28

http://suite.tistory.com/ fs 2008 2


요즘 하는거 IP 검색

Intellectual Property 지적 재산권 ~~~


발명특허, 실용신안, 의장, 상표 도있따~~

:
Posted by mastar
2008. 5. 15. 19:28

5개월 프로젝트 마무리중~~ 용-ILE/잡다구리2008. 5. 15. 19:28

http://suite.tistory.com/

- 서버내  디렉토리는 대분자로??
- a_ b_ 구분으로 파일 일련되게??
- 초기화를 한번만 하고 사용해서 '접근허용' 안나오게등..  ??

- 입력/수정 따로 분리하자~~~

:
Posted by mastar
2008. 5. 15. 19:27

감리시 문서 작성 용-ILE/잡다구리2008. 5. 15. 19:27

http://linuxmaster.tistory.com/
http://cafe.naver.com/linuxmaster


개발다하고  문서만들기~~ 로꾸꺼~~

작성할께 참많다~~~ fs 2008.01

                                               < version 0.1 >

사업관리 계약관리 제안요청서  
계약서  
착수계  
산출내역서  
제안서  
프로젝트표준    
풀질관리 풀질화동계획서  
품질검토  
산출물관리대장  
의사소통관리 의사소통계획서
주간보고
월간보고
회의록
워크샵
요청서
변경관리    
이슈관리    
위험관리    
일정관리    
월간인력현황보고    
개발 분석 범위 비교표  
인터뷰정의서  
현업요구사항 정의서  
설계 기능차트  
기능차트  
보안계획서  
아키텍쳐설계서  
페이지표준정의서  
컨텐츠구조도  
네비게이션흐름도  
페이지목록  
페이지레이아웃  
프로그램목록  
데이터코드설계서  
테이블목록  
테이블정의서  
프로그램대테이블상관도  
프로그램사양서  
테스트계획서.시험계획서  
요구사항추적표  
시스템전환계획서  
데이터이관계획서  
구축 페이지파일  
소스코드  
단위시험결과서  
시험 통합시험결과서  
시스템시험결과서  
데이터이관계획서  
웹접근성체크점검표  
홈페이지운영지침  
개발서버장비사양  
전개 사용자지침서  
운영지침서  
유지보수계획서  
교육계획서  
장비도입 실시설계    
설치보고서    
참고자료    
감리 감리계획서    
감리조치내역서    
준공 검수보고서    
완료보고서    

 

:
Posted by mastar

http://suite.tistory.com/ fs


INSTALL 파일에 나와있다

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~


    By default the ProFTPD files will be installed as user 'root' and the
    first group with gid 0 listed in /etc/group, usually 'root' or 'wheel'.
    If you wish to install using a different user or group ownership, set
    the install_user and install_group environment variables before running
    configure.  Using a Bourne-ish style shell (e.g. sh, ksh, bash), you can
    do this on the command line like this:

        $ install_user=root install_group=wheel ./configure


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~`



하지만 실행은 반드시 root 만~~

http://www.proftpd.org/docs/faq/linked/faq-ch4.html#AEN253


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

2. "inet_create_connection() failed: Operation not permitted".

You aren't starting ProFTPD as root, or you have inetd configured to run ProFTPD as a user other than root. The ProFTPD daemon must be started as root in order to bind to tcp ports lower than 1024, or to open your shadow password file when authenticating users. The daemon switches uid/gids to the user and group specified by the User/Group directives during normal operation, so a "ps" will show it running as the user you specified.


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

 

:
Posted by mastar

http://suite.tistory.com/

#lsof -i | grep 10101         //10101포트를 사용하고 있는 프로세스를 확인할 수 있다.

#fuser -n tcp 10101          //10101포트를 사용하고 있는 프로세스의 PID를 보여준다.

아님 그냥 #netstat -ae

리눅스에서...

 

:
Posted by mastar


http://suite.tistory.com/  fs   2006 12 20

AWK  숫자 구별 ?


 src_file의 $2 값이 숫자일때  적당히?  Integer 사이즈를 생각하고

그냥 충분히 200000 보다 큰놈만 출력 그럼 문자열 나온다.


awk '{if($2 > 200000) print 50"\t"$2}' src_file > target_file


awk 문자열 길이 한글자 이상


length 함수 이용


awk '{if(length($2) > 1) print $2}' src_file  > target_file


특이한 점은  한글  한글자와 영문 한글자를  모두 한글자로 인식한다.

 

:
Posted by mastar
2008. 5. 15. 19:24

검색 용어S.. 용-ILE/잡다구리2008. 5. 15. 19:24

http://suite.tistory.com/

2006 10 


여기 저기 짜집기 검색 용어 정리 ㅋㅋ 믿거나 말거나~~~~


용어 이름<?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" /><?xml:namespace prefix = o />

설명

전문 검색

(FTR) Full Text Retrieval

어떤 정보의 본문 전체 내용을 색인 형태로 제공함으로써 각종 데이터를 신속 정확하게 검색할 수 있도록 지원하는 시스템 이다.

색인

INDEXING

색인이란 입력 문서를 형태소 분석하여 그 문서를 효과적으로 표현하는 색인어를 추출하는 과정이다 입력 문서를 구성하는 다양한 유형의 어절 및 문자열을 그 형태에 따라 구분하여 그 유형에 맞는 분석 방법을 선택하게 된다.

형태소 분석

Morphological Analysis

형태소분석이란 사전과 형태소 분석 문법을 이용하여 주어진 입력 문장을 최소 의미 단위인 형태소로 분리하는 과정을 말한다.

 

 

 

웹 크롤링

Web Crawling

웹 페이지들을 방문하여 모든 내용을 읽고 웹 페이지에 링크되어 있는 페이지들을 차례로 방문한다. 그리고 일정한 기간을 주기로 자신이 과거에 방문했던 웹 페이지들을 다시 방문함으로써 해당 페이지의 갱신여부를 체크하는 과정을 크롤링이라 한다.


 

 

공유 메모리

Shared Memory

한 개의 메모리를 여러 처리장치(프로세서)가 공동으로 사용하는 형태의 기억장치 또는 다중처리(multiprocessing) 시스템을 사용할 때 여러 프로세서가 하나의 기억장치를 공유하여 사용하는 것을 의미한다.

검색 시스템은 빠른 속도의 문서 검색을 위해 색인 볼륨에 저장된 정보를 공유 메모리에 캐쉬하여 사용한다

유사도

Similarity

검색엔진에서 검색된 각 결과 레코드에 부여한 검색 질의의 빈도수 이다.

 

 

 

 


 


































자연어 검색

Natural Language Searching

일반 문장으로 입력한 내용을 형태소 분석하여 검색 결과를 얻어 온다.

불리언 검색

Boolean Searching

불리언(boolean) 연산자 AND, OR , OR(벤더사마다 다름)를 이용하여 자세하게 검색을 수행한다.

AND : 해당 단어가 모두 포함된 문서를 검색

OR : 해당 단어 중 하나라도 포함하는 문서를 검색.

NOT : 해당 단어 중 NOT  이하 단어를 포함하지 않는 문서를 검색

불용어

Stopword

검색 용어로 사용하지 않는 단어. 관사, 전치사, 조사, 접속사 등 검색 색인 단어로 의미가 없는 단어 해당하는 불용어는 색인은 하지 않는다.

유사어 검색

Similarity Searching

정보 검색의 유사단어 추천 시스템은 한글 및 영어 단어에 대한 유사철자 단어를 추천하는 시스템이다.

예를 들어, ""이라고 검색한 경우, 보다 다양한 검색어로 "가래떡", "시루떡", "개떡" 등의 유사 철자 단어들을 추천하는 시스템이다.

웹 로봇

Web Robot

스파이더(spider) 혹은 웹크롤러(crawler)라고도 불리는 로봇은 웹에 있는 웹페이지를 방문해서 모든 내용을 읽어 온다. 이 때 한 페이지만 방문하고 마는 것이 아니라 그 페이지에 링크되어 있는 또 다른 페이지를 차례로 방문한다. 이처럼 링크를 따라 웹(web 거미줄)을 돌아다니는 모습이 마치 거미와 비슷하다고 해서 스파이더라고 부른다.

절단 검색

Truncation Searching

검색시에 입력된 문자열로 시작하는 단어는 모두 검색해 준다든가 하는 기능을 절단검색이라고 한다. 절단검색에는 검색어 뒷부분의 변화를 허용하는 우측절단을 비롯하여 앞부분의 변형을 허용하는 좌측절단 검색 등이 있다

절단 적용은 '*' (벤더사마다 다름)

- 우측 절단 검색 Right-Truncation

ex) 정보*

정보검색, 정보수집,정보시스템

- 좌측절단 검색 : Left-Truncation

ex) *정보

 시스템정보,상황정보,

- 양측 절단 검색 : Both-Truncation

우측절단과 좌측절단을 함께 적용

ex) *정보*

정보화, 검색정보시스템.













































n-gram

n-gram

n-gram이란 입력된 문자열을 n개의 음절단위로 절단하는 방법이다.

예를 들어 "정보검색" 이란 문자열을 절단할 때.

1-gram : , , , 색 으로 분리

2-gram : 정보, 보검, 검색 으로 분리

3-gram : 정보검, 보검색 으로 분리

첨부파일 필터

Document Filter

검색엔진 색인시에 문서 데이터(pdf, doc, xls, ppt, hwp )를 추출하여 TEXT 형태로 변환하고 이를 색인 하여 검색에 활용할 수 있도록 한다.

메타 검색

<?xml:namespace prefix = st1 ns = "urn:schemas-microsoft-com:office:smarttags" /><?xml:namespace prefix = st1 />Meta Searching

메타 검색이란 여러 검색사이트들의 검색 결과페이지를 받아와 적절히 가공하여 검색 결과를 공통 포맷으로 일반화 한 후 이를 다시 정제하여 보다 나은 검색 페이지를 제공하는 것이다. META 검색 솔루션 검색엔진은 자체적인 검색기능은 갖고 있지 않다.


 

:
Posted by mastar