Find Jobs
Hire Freelancers

C code to index large text library and find similar

$250-750 USD

ปิดแล้ว
โพสต์ มากกว่า 5 ปีที่ผ่านมา

$250-750 USD

ชำระเงินเมื่อส่งงาน
I need a mini-app (Compiled C on Linux) that groups similar sentences together. I have 100,000 sentences (say in a PostgresSQL DB, Unicode text). It must perform VERY fast - by indexing each root-word to a 16bit integer (which would reduce its memory foot print), then re-creating a new data structure with sentence delimeters and sentence length. Group into buckets of similar sentence length. Then iterate through doing word-by-word comparisons (16bit comparisons). Two algos are acceptable:- 1. Simple - Take a source sentence and iterate through XORing word by word (irrespective of word order or word frequency). If there are more than x words outstanding - then it is NOT a similar sentence. X in this case would be 25% of the number of total words. We leave such large gap so that we don't need to worry about word roots. From the smaller data set - we then proceed to do a classic levenstechn comparison - but with an upper bound of x deviation - meaning after it detects more than say 10% deviation - it exists that comparison. Here it is a character by character comparison. The app should communicate with a folder of .gz files that contain the text and it could use a text boundary to distinguish each sentence. The output would need to be a new text file that sorts every sentence into groups of similarity - separated by a text boundary. I need something in 36 hours. A mediocre algorithm is fine.
รหัสโปรเจกต์: 17551738

เกี่ยวกับโปรเจกต์

9 ข้อเสนอ
โปรเจกต์ระยะไกล
ใช้งานอยู่ 6 ปีที่ผ่านมา

กำลังมองหาการสร้างรายได้ใช่ไหม?

ประโยชน์ของการประมูลกับ Freelancer

กำหนดงบประมาณและกรอบเวลาของคุณ
รับเงินจากการงานของคุณ
อธิบายข้อเสนอของคุณในภาพรวม
ลงทะเบียนและเสนอราคาฟรี
9 ฟรีแลนซ์กำลังเสนอราคาโดยเฉลี่ย $372 USD สำหรับงานนี้
รูปอวาตาร์ของผู้ใช้
You can trust my expertise, I can finish in time, thanks a lot! I am very proficient in c and c++. I have 16 years c++ developing experience now, and have worked for more than 7 years. My work is online game developing, and mainly focus on server side, using c++ under Linux environment. I made many great projects using c++, for example, I made the tools which could convert java codes into c++ scripts, of course garbage collection included, this was very similar to a compiler, and was very complex. I also made our own mobile game using c++, I can show you the demo of client, if you like. I am very proficient in java also. I have a very good review on Freelancer.com, I never miss a project once I accept the job, you can check my review. Trust me, please let expert help you.
$300 USD ใน 1 วัน
4.9 (202 รีวิว)
7.3
7.3
รูปอวาตาร์ของผู้ใช้
Hello, I have more than 6 years experience writing software with Python. I can make a very fast, maintainable script for this in Cython if you are interested? Consider that: 1 - The main slowdown is from cache misses during string iterations and comparison 2 - Python like C is a first class citizen on Linux 4 - Cython allows you to create a stand alone executable (Python embedded) 3 - Python script will be more maintainable and portable If C is a strict requirement don't mind me :)
$250 USD ใน 0 วัน
5.0 (8 รีวิว)
4.7
4.7
รูปอวาตาร์ของผู้ใช้
Hello, I'm c developer with 6+ years of experience and mathematician with a number of publications. Also I'm participant and problem writer of many algorithm competitions (Topcoder, ACM ICPC, etc). Just 2 weeks ago I implemented very similar algorithm on c++ (I implemented document clusterisation using tf-idf metric both for words and for phrases), so I have at least 40% of code already written. I can finish it in 24 hours if you explain me some details which I didn't get from your description. Feel free to contact me to discuss any details of the project. Looking forward to hearing from you!
$300 USD ใน 1 วัน
3.2 (33 รีวิว)
6.9
6.9
รูปอวาตาร์ของผู้ใช้
Hi im free so i can do this type of jobs in quick manner as you have 36 hours for the job lets dont waste the time and get it started
$555 USD ใน 10 วัน
5.0 (8 รีวิว)
4.1
4.1
รูปอวาตาร์ของผู้ใช้
Hello, I am an experienced algorithm designer and would really like to work on your project. I appreciate how detailed your project description is and have understood every aspect of it. Award me the project and I will get started immediately. Thank you and I look forward to working for you.
$250 USD ใน 3 วัน
4.9 (11 รีวิว)
3.2
3.2
รูปอวาตาร์ของผู้ใช้
I have expertise in C/C++ My plan to solve this thing: 1) You give me example of dataset 2) I do rapid prototyping in python and show you approximate result of algorithm execution and timing. 3) If you like it I rewrite it in C
$333 USD ใน 2 วัน
5.0 (1 รีวิว)
2.6
2.6
รูปอวาตาร์ของผู้ใช้
Hi, I have 4 years of experience in C/C++ development in Linux environment. Looking forward for your response to discuss further. Regards, Akram
$250 USD ใน 1 วัน
4.9 (5 รีวิว)
0.8
0.8
รูปอวาตาร์ของผู้ใช้
Hi, Hope you doing well sir i read your message in given below i make sure you that i can help you to build mini-app (Compiled C on Linux) that groups similar sentences together. as better as per your given requirement well sir i make sure you one thing that i will provide you well quality service rather to just give you quantity service so i can do this for you as per your given requirement Thanks Ashish
$555 USD ใน 10 วัน
0.0 (1 รีวิว)
1.6
1.6
รูปอวาตาร์ของผู้ใช้
Dear Prospect Hiring Manager. Thank you for giving me a chance to bid on your project. i am a serious bidder here and i have already worked on a similar project before and can deliver as u have mentioned I have checked your requirements. We have right skills to work on this assignment. We are a team of professionals including experienced analysts, designers, project managers, developers and QA people having great expertise in web applications development mainly on core PHP, PHP with open sources (Joomla, Wordpress, Codeigniter, Cake PHP), .NET, Asp.NET, Vb.NET, HTML 5 etc. and mobile applications on ios and Android platform. Our award = superb result = happy client. In a good partnership, good results happen. Good cooking makes good eating!BWe consider our client as our partner. I am ready to discuss with you with best Regards
$555 USD ใน 10 วัน
0.0 (0 รีวิว)
0.6
0.6

เกี่ยวกับลูกค้า

ปักธงของ AUSTRALIA
Ultimo, Australia
4.9
16
ยืนยันวิธีการชำระเงินแล้ว
เป็นสมาชิกตั้งแต่ ก.ย. 17, 2013

การยืนยันลูกค้า

ขอบคุณ! เราได้ส่งลิงก์สำหรับเครดิตฟรีให้คุณทางอีเมลแล้ว
เกิดข้อผิดพลาดขณะส่งอีเมลของคุณ กรุณาลองอีกครั้ง
โลโก้ Freelancer Thailand / ภาษาไทย ช่วยเหลือและสนับสนุน FreelancerประเภทโปรเจคการประกวดFreelancerองค์กรแพ็กเกจสมาชิกโครงการ Freelancer ชั้นแนวหน้าการจัดการโปรเจคงานในพื้นที่Photo Anywhereหน้าจัดแสดงผลงานAPI สำหรับนักพัฒนาได้รับการยืนยันDesktop App เกี่ยวกับเกี่ยวกับเราวิธีใช้งานความปลอดภัยนักลงทุนแผนผังเว็บไซต์เรื่องราวข่าวออกสื่อทีมรางวัลข่าวประชาสัมพันธ์ร่วมงานกับเรา ข้อกำหนดนโยบายความเป็นส่วนตัวข้อกำหนดและเงื่อนไขนโยบายลิขสิทธิ์ข้อพึงปฏิบัติค่าธรรมเนียมและค่าบริการหุ้นส่วนEscrow.comLoadshiftWarrior Forum แอปโลโก้ Apple App Store โลโก้ Google Play
ไม่สามารถคัดลอกไปยังคลิปบอร์ดได้ โปรดลองอีกครั้งหลังปรับเปลี่ยนการอนุญาต
คัดลอกไปยังคลิปบอร์ดแล้ว
ผู้ใช้ที่ลงทะเบียน งานที่มีการโพสต์ทั้งหมด
Freelancer ® is a registered Trademark of Freelancer Technology Pty Limited (ACN 142 189 759)
Copyright © 2024 Freelancer Technology Pty Limited (ACN 142 189 759)
กำลังโหลดตัวอย่าง
ได้รับอนุญาตสำหรับตำแหน่งทางภูมิศาสตร์
เซสชั่นการเข้าสู่ระบบของคุณหมดอายุและคุณได้ออกจากระบบแล้ว กรุณาเข้าสู่ระบบอีกครั้ง