Папки, теги, системы именования файлов и софт для всего этого. Все, чтобы ты легко отыскал нужный шебм или ехидного колобка среди терабайтов мусора после десятилетия капчевания.
Странно, что нет обсуждения этой фундаментальной темы, но если не взлетит, то и хуй с ним.
69 yob можно довольно быстро пролистать и выбрать нужного. С тысячей так уже не прокатит. Придется подробнее называть, например oche_bolshoy_yoba.jpg и grustniy_yoba.jpg.
>>363300
Но ведь это совершенно не помогает найти содержимое файла с нужным описанием. Для тупо поиска по имени есть Everything.
Чего тут обсуждать? Нормально делай - нормально будет. А не вот это вот
> терабайтов мусора
Пиздато бы если анон подогнал прогу с OCR по которой можно бы было прогнать папки балком и массово переименовать файлы в них в зависимость от надписей на пикчах.
Откуда мне было знать, будучи молодым и шутливым, что у меня окажется 50к картинок?
Макось кстати по дефолту ищет с OCR с недавних пор. Даже на скриншотах текст может распознать и по нему искать.
Медленно правда (ну и в целом файндер убогий) и описательный только на английском работает.
>На шинду
xyplorer последнее что было вменяемым
Но вообще тэги руками выставлять гиблое дело, надо чтобы софт сам тэги парсил.
> 2023 год от сотворения компьютера
> единственное место, куда пользователь может сохранить метаданные своих файлов - это название файла
Это, кстати, самый большой проеб для тэгоблядей. Весь софт использует свои манябазы данных, которые серят тупо при переносе или переименовании данных вне проги. А в название файла и не засунуть - проводник до сих пор не может больше чем в 260 символов.
Внутрь файла можно, большинство форматов поддерживают метаданные в самом файле, но все по-разному.
Тут скорее проблема что нет единого протокола как для форматов файлов, так и для форматов мета информации в них.
Моё говно в данный момент валится в одну кучу. С той лишь оговоркой, что применяется AutoHotKey-скрипт: по нажатию Ctrl+Пробел к имени сохраняемого файла цепляется таймкод.
Это хоть немного, но упорядочивает анальный хаос из пикчей и шэбэмов.
И позволяет привязать это всё к сохраняемым в закладки сессиям браузерных вкладок.
В браузере Ctrl+Shift+D - вызов окна сохранения группы вкладок. И снова Ctrl+Пробел, чтобы отработал скрипт создания таймкода
А так-то надеюсь на искусственный интелект, который придёт и отсортирует весь говняк по-человечески
> А так-то надеюсь на искусственный интелект, который придёт и отсортирует весь говняк по-человечески
А разве такого еще нет? Я вот недавно на тред натыкался, где яндекс в текстовом формате пересказывает краткую суть видосов.
В идеале, нужен кроссплатформенный софт, который помимо сканирования свойств и тегов внутри файлов, позволял бы добавлять свои метки/теги. А на основе этих данных уже можно делать поиск по условиям, к примеру накидал ему условий: пикча, с тегом #yoba, датой создания файла до 2020, разрешением не более 1000х1000 и чтоб оно высрало список подходящих под условие файлов. Также можно было бы составлять динамические списки файлов на основе всех данных.
Пробовал некоторый софт, для галерей и аудиотеки, но они все кривые, с недостатками и не кроссплатформенные
Выхода особо нет. Ограничение в 256 символов не даст записать все теги с картинки той же буры. Поэтому выхода 2.
1) Hydrus Network, Stash, Lanraragi, Calibre, Jellyfin
2) Иметь файл, например, картинку. И txt повторяющий имя картинки, например, 1.png.txt. Тогда можно искать файл через content:"blonde 1girl" и всё такое. Выдаст текстовик, но достаточно убрать .txt, чтобы найти нужное.
По факту это называется sidecar file и используется xpm формат. Или json. Или просто текстовый, как самый расхожий вариант. Ни имя файлов, ни папка не сохранит несколько сотен символов тегов, которые встречаются в бурах.
Есть такой вариант.
Загружаешь картинки/видево на специальных платформах, типа имгура/вимео или вкатываешься в селфхост. Сохраняешь урлы в специальной программе для хранения ссылок/втором мозге, типа obsidian. Там и тэги, и ссылки, и даже граф есть.
Вот эти варианты с хранением все на своем пк это костыль, поэтому и тулз уже нет десятилетиями.
>Загружаешь картинки/видево на специальных платформах, типа имгура/вимео
Жить в 2к23 в РФ и все хранить файлы в облаке - это вверх слабоумия и отваги. В какой-то момент либо сервис скажет "извините, пидоранов не обслуживаем" либо ркн выебет сервис и будешь с обосраной дупой выкачивать из него всю инфу с хреновой скоростью впн-а.
А вот про селфхост здравая тема, поднять тот же jellyfin/Kodi для медиаговна, stash для прона, koel или ещё что-нибудь для музыки, докспелл для офисной хуйни итд.
> и будешь с обосраной дупой выкачивать из него всю инфу с хреновой скоростью впн-а
В 2023 даже тор с нормальной скоростью. Ну и впн в 2023 должен быть включен всегда, лично я совсем не ощущаю какие-то попуки со стороны ркн или геоблоки корпов.
>>371117
Ну не нравится, значит страдай. А вот видеорил пример успеха анона. Не хочешь менять свои привычки и рабочие процессы — сосешь.
(Автор этого поста был забанен. Помянем.)
>А вот видеорил пример успеха анона.
Видрил можно было в разы легче и лучше сделать в stash, который специально для этого и пилится, а не в программе для текстовых заметок. Это пример усердного забивания болтов молотком, а не успех.
Ты ошибаешься, это совершенное разные подходы. Стэш нахуй не нужен, если ты не собираешься шарить порнуху, а порнуха это такое, дело личное, собственная коллекция, поэтому веб-сервер лишний. Только если ты совсем порно дебил с выжженными рецепторами, который везде хочет дрочить и с мобилы через впн будет чекать свою коллекцию в туалете на работе.
Нет, не обязательно шарить это говно, это просто селфхост приложение для сортировки и организации прона, буквально гуйня поверх базы данных, можешь работать даже без доступа в сеть. Тоже самое, что сделано на твоём видео, но без костылей в виде кучи плагинов и миллиарда гиперссылок. Ещё раз говорю - гвозди забивать, болты крутить.
Это не костыль, бд не всегда нужны, есть flat file и plain text. Конкретно в этом кейсе хватит обычной файловой системы и мд, то, что запрашивал анон.
А жопу рукой можно подтереть, я понял. Иди костыли городи, делай вручную миллиард гиперссылок, тратя сотни часов, архив прона на маркдаун-файлах, который начинает лагать банально от вида граф-вью вместо лаконичных таблиц в бд. Придумывай с нуля велосипед на десятках разношёрстных плагинах от васянов, когда рядом лежит уже готовое приложение, заточенное специально под нужный тебе юзкейс. Твое дело, как насиловать свою жизнь.
Олсо как у тебя в голове считаются "ряяя нинужно, простота, KISS, да мы все на плейнтексте скостыляем и велосипедом закусим" и использование обсидиана, который является говном на электроне и жрет килотонны памяти при большом ваулте - непонятно. Я бы понял если бы в емаксе сидел ссылочки дрочил, но здесь же очевидно один бинарник, sql-бд и пара конфигов проще, чем это нагромождение хромокала, я прям чувствую как она пердит и лагает.
Я где то сказал, что я его ненавижу? Я просто констатировал факт, что есть более лаконичные и менее требовательные как к ресурсам компьютера, так и к затратам времени решения для заданного тобой юзкейса. У тебя же один ответ - "ряя нинужно, я в своем любимом обсидиане все сделаю". Вот ты реальный сектант, у которого каша в голове.
Я не страдаю. Я использую hydrus network, который ещё и скачивает пикчи.
Твой видеорил сбрасывал в обсидианотред лично я и местным он так зашел, что красовался в оппосте. И да, это маразм, потому что есть jellyfin с плагином для аниме и jav.
Использовать для этого obsidian, который будет ворочать миллионами файлов в поисках тегов это дебилизм. Вдвойне дебилизм перед этим заливать пикчи на имгур, так как в таком случае разумнее использовать буры.
Дружище, нет единого верного подхода. Конкретно для юзкейса опа и его рабочего процесса, подходит вариант с файловой системой, а не селфхост, он вообще про такое не слышал наверное. Это ты не хочешь слушать, и визжишь про костыли, а не я.
>>371245
Пиздишь, видео скидывал я. Заебал семенить уже.
>вариант с файловой системой, а не селфхост
У тебя реально каша в голове нахуй, ты же понимаешь что в бд сташа точно такие-же пути до файлов в твоей файловой системе, только в формате одной базы данных, которую элементарно централизованно обновлять и изменять, а не тысячи маркдаун файлов с гиперсылками на друг друга и путями до файлов?
>Дружище, нет единого верного подхода
Да, но есть более оптимальный. Говно можно выиграть камнем, но неудобно и жопа потом зудит.
Вот как. Тогда ты знаешь, что изначально видео весит 47 мб и не влазит в лимит, поэтому его жал я. Ну хорошо, мб подскажешь откуда оно взято. Нет? Как жаль.
с форчана, тредов cumg.
Ты слишком узколобый. Заметь, я сразу указал на несколько разных стратегий для решения проблемы опа и инструменты к ним. Ты же с пеной у рта уже полдня мне пытаешься доказать, что вот именно твой стэк ЛУЧШЕ.
> только в формате одной базы данных
Я тебе еще раз говорю, что базы данных нужны не всегда и не везде, мистер Даннинг Крюгер.
> Да, но есть более оптимальный
Для опа селфхостинг не является оптимальным. Или ты предлагаешь у себя на компе это поднимать? Тогда в каком месте это легче электрона и вообще причем тут электрон, когда бэкэнд данных в мд? Ты полностью подменяешь понятия и не понимаешь о чем говоришь.
Ты ж споришь ради спора и последнего вскукарека. Ты ж нихуя не понимаешь и обосрался на моменте залива на имгуи(где хентай запрещен и любая пикча может быть выпилена) с которого корировать ссылку, вручную писать теги и делать миллионы мд файлов.
Ты ж реально мудак. Или тролль.
Мимокрок
>несколько разных стратегий для решения проблемы опа и инструменты к ним
Ты предложил хранить все свои файлы на имгуре и использовать тысячи макдаун файлов. Твои стратегии просто хуевые и все что ты можешь ответить в их защиту - "нинужно" и "ну всеж мы люди, все стратегии хороши...", пока тебя полдня макают головой в урину.
>Я тебе еще раз говорю, что базы данных нужны не всегда и не везде, мистер Даннинг Крюгер.
Базы данных нужны для структурирования информации. Это то что нужно опу. Ты же пытаешься изобрести велосипед, базу данных при помощи текстовых файлов.
>Или ты предлагаешь у себя на компе это поднимать? Тогда в каком месте это легче электрона
Ты серьезно сравниваешь полноценное приложение, которое ворочает кучей файлов и веб-гуй над одной базой данных по части производительности, лол? Или ты блядь совсем оторван от реальности?
> и вообще причем тут электрон, когда бэкэнд данных в мд?
При том, что ты запостил обсидиан. Показывай как твой бэкэнд будет охуенно работать вне него, без всех плагинов
Просто храни данные в российском сервисе. В чем проблема?
>>371274
> обосрался на моменте залива на имгуи
> Ты предложил хранить все свои файлы на имгуре
Где вы увидели хентай в реквестах опа, где вы увидели, что я рекомендовал имгур, а не упомянул его для примера? Пидорасы вы же банально ЧИТАТЬ не умеете.
> базу данных при помощи текстовых файлов.
Да это называется flat file, nosql, you name it. Если ты не понимаешь юзкейс, то твои проблемы. Идиот блять, но ты все равно ничего не поймешь, так и будешь дальше срать про бд.
> Ты серьезно сравниваешь полноценное приложение, которое ворочает кучей файлов и веб-гуй над одной базой данных по части производительности, лол? Или ты блядь совсем оторван от реальности?
Да, дружище, веб-сервер с бд легче плейнтекста и редактора текста. Ты же вообще не айтишник, дружок.
> обсидиан
Я упоминал его для примера, а не железно рекомендовал использовать обсидиан. Что еще раз доказывает, твое туннельное зрение и маниакальную фиксацию. Скорее всего ты имеешь плохой пользовательский опыт конкретно с обсидианом поэтому несешь хуйню. Собственно это сразу ты и выпукал, когда сослался на электрон.
Зачем ты разговариваешь с человеком который хранит свои файлы на имгуре?
Организовывать файлы в 2023 методами из 2003 года бессмыслено. Ожидайте пока для вашей ос запилят индексацию с эмбеддингами и пользуйтесь нормальным поиском.
Скидывать все в одну папку и забить хуй
Твоё не нормисное решение?
Забей хуй там суп вилкой едят. Из 98 года капчуют и файлики свои оттуда же стерегут 25 лет
Как так сделать?
1. Нахуя тебе тегов больше чем на 256 символов? Ты по ВСЕМ этим тэгам потом захочешь искать?
2. Ты ведь в курсе что в ntfs лимит этот условный и он отключается? (увеличивается до 32,767 символов)
1. Да. Ситуация, цвет волос, прозрачность. Если это о.с. то поиск идет чисто по косвенным признакам.
2. Это длина пути, а не имени файла. Длина имени 255 (или 256) символов.
В прочем на ЖИРНУЮ флешку действительно не скопируешь. Но этого всё равно никто не умеет.
На дельфине, не? Переустанови я ос на другой диск, что будет с тегами? Выбери я другой менеджер? Да и как вручную тегировать файлы с бур, если их миллионы...
>На дельфине, не?
Не. Эта срань хранится в xattr, а они в файлухе на равне с именем файла. Поддерживается всеми лапчатыми файлухами и большинством софта, что имеет теги.
>Да и как вручную тегировать файлы с бур, если их миллионы...
Я пытался наваять тулзу для поиска по имени файла\хэшу на пиксиве, бурах и т.д., но дальше полурабочей демки так и не доделал...
>2. Это длина пути, а не имени файла. Длина имени 255 (или 256) символов.
Файла тоже, погугли.
Гуглил. Это нововведение в шинду 10 и касается только длины пути. Если я ошибаюсь, пожалуйста, ткни носом.
Интересно. Пишут, что проводник продолжает ошибаться при работе с такими файлами. Ну хорошо...
https://remontka.pro/long-file-name-path-errors-windows/
Но баш это только Линукс. Интересно, а можно в Линуксе иметь длинные имена файлов по типу винды, которые больше 255 символов?
И с одной стороны это круто, если длинные имена файлов с тегами, а совместимо ли оно с андроидом тем же?
баш это любой unix-like и даже свиндовс, если очень хочется.
Ты серьёзно в 2024 году собрался ручками теги в названии файла прописывать?
Нужен новый универсальный медиаформат с метадатой в формате токенов для сегментации на основе контента внутри.
Есть такой чел, Karl Voit. У него есть целый свой сайт по Personal Information Management, называется public voit. Адрес сам загугли.
Так вот он сделал какие-то скриптики, чтобы легко добавлять и удалять тэги, иметь controlled vocabulary тэгов, и что-то вроде виртуальной файловой системы для навигации по тэгам, называется вроде tagtrees. Тэги тупо хранятся в именах файлов. У него много опыта с этим и статей всяких куча. Советую почитать.
На посты на немецком можно не обращать внимания.
Я знаю о нем, о шизе джонни децимале, о паре, аксессе, о сабреддитах datahoarder, datacurator.
Везде проблема в том, что там всё дистиллированно: пример с парой файлов. Никто не говорит что делать, когда файлов буквально миллионы лол.
>>381448
Ну, вообще, мои файлы, например, в основном с бур. И там можно сохранять имя в виде тегов или создавать тексовый файл.
Кстати, чем плох текстовый файл с данными, которые перенесены на новую строку?
1.png
1.png.txt
В текстовике пишутся теги типа
pepe
meme
parody
sad
emotion
И так далее. И искать нужное по contebt: через шиндопроводник. Линукс же тоже так умеет.
> Кстати, чем плох текстовый файл с данными, которые перенесены на новую строку?
> В текстовике пишутся теги типа
> pepe
> meme
> parody
> sad
> emotion
Это тупиковый путь. Все теги не напишешь, а если файлов много, то мейнтейнить их на постоянной основе почти невозможно.
Теги не должны быть словами в привычном человеческом понимании.
Ну нету такого, нет. Это называется sidecar files, основной формат которых xmp. Но ним никто почти не пользуется.
Вторая альтернатива это теги в именах. И если шинда поддерживает длинные имена, то в чем проблема. Какие файлы анон имеет, которые нужно именовать вручную, а не bulk rename utility.
Неудобны и непрактичны оба подхода, потому что они изначально строятся на костылях. Имя файла - не место для тегов, а метадата должна содержаться внутри самого файла в отдельных структурированных полях.
Ещё раз повторюсь, что прописывать теги словами - тоже костыль.
Контент должен быть векторизирован и записан в метадату для поиска по любым запросам, которые имеют к нему отношение.
Так нет такого. Поэтому и приходится выбирать лучшее из худшего. А имена файлов хоть не потеряются при копировании и не вендорлокают.
Для текста вполне себе существует технология уже несколько лет, бери да делай инструмент.
https://developers.generativeai.google/examples/doc_search_emb
Для изображений есть уже даже готовое решение
https://github.com/yurijmikhalevich/rclip
У меня есть сомнения, что оно найдет анимудевочку лучше, чем hydrus network или стандартный поиск по имени файла. Хотя я не верю, что имя файла >255 символов можно безболезненно использовать на любых машинах с любой ос.
>Ну, вообще, мои файлы, например, в основном с бур. И там можно сохранять имя в виде тегов
Именно, есть даже скрипты чтоб интересные тебе тэги сохранялись в именах картинок которые ты сохраняешь (handyimage например)
Люди которые хотят сохранить все 100500 тэгов помоему вообще ебанулись, они ведь никогда по ним и искать то не будут
У меня проблема в том, что не могу организовать структуру папок, которая бы затем переходила в файлы, если уж говорим про буры.
Есть:
- авторы
- франшиза (дополнительно делится на аниме, игры, мультсериалы)
- компиляция (по сути, это жанры. Вот эти все эльфийки, мейды, юбочки вот это всё сюда)
Но проблема же в том, что автор может рисовать как оригинального персонажа, так и персонажа игры. И куда это класть? А если это темнокожая эльфийка в мейдоплатье?
В общем, у меня с этим проблемы. И тот же Hydrus network просто сохраняет всё в базу данных. Но проблема очевидна — это софт. А раз так, мы замыкаемся на нём. Мы не можем бэкапить. И по сути, ценность софта только как граббера — я же не стану задавать теги каждой картинке с двача или портить архив порнолаба. Плюс, он плохо работает с последовательностями и не дает перекодировать форматы.
Вот бы найти какие-то советы, как с таким работать. Да и какие теги интересны? Как минимум, персонаж, автор, франшиза.
Произвольно выбранное ограничение «хочу что-нибудь на базе файловой системы и утилит» нелогично. Калькулятор тоже ведь можно сделать при помощи ссылок, но все почему-то пользуются какой-то программой для вычислений. Ну и развитие программ обычно идёт от усложнения структуры файлов на диске к замене нормальной базой данных, а не в обратную сторону.
Те, кому надо работать, пользуются работающими средствами.
И как ты запишешь что-то в файл, формат которого не поддерживает теги. И где гарантия, что оно не потеряется при переносе?
Потому для хранения и используются форматы, в которых можно метаданных любое количество напихать. Вон для JPEG их даже две штуки придумали, не договорившись, и до сих пор под капотом так.
Если у тебя при переносе файла его содержимое меняется, то что-то не так с твоим устройством.
Ну так, а если нужна прозрачность? Что с пнг делать? Вебп? Рав файлами?
Мне кажется, удобнее уже тупо изучить базово программирование и сделать себе свой софт с бд.
Так дело не пойдёт. А что делать с гифками? А что делать с видосиками? А что делать с программами, которые рендерили какие-то картинки? А что делать с настройками печати отдельными цветами? А что делать с исходниками для графических редакторов и шаблонами, которые потом понадобятся, чтобы что-то в одном стиле делать? А что?..
У тебя условия расползаются как тараканы. Это намёк, что на самом деле ты под решение ищешь задачу.
В реальных системах у тебя, например, TIFF (куда можно запихнуть что угодно, но не нужно) и чёткие требования к форматам, которые хранятся. Никто не решает, как образ для Playstation туда запихнуть, чтобы иметь источник оригинальных спрайтов.
Почему же задачи расползаются? Вот бура. На ней есть пнг и жпеги, мп4. Вот этому хозяйству и нужны теги.
Увы, пока реальной альтернативы связке hydrus network и stash я не вижу.
>И куда это класть?
Кладу всё это в одну папку, потом ищу по слову эльфийка или мейд т.к. они есть в именах файлов
> Да и какие теги интересны? Как минимум, персонаж, автор, франшиза.
Те, по которым ты будешь искать. (А автор и персонажи автоматом сохраняются handyimage когда сохраняешь с бур по ctrl+s)
>А ты знаешь какие теги тебе будут нужны лол?
Которые мне интересные блядь, по которым я уже ищу на бурах и захочу пересмотреть у себя на диске
, вы тут вообще все ебанутые чтоль?
Ну да, я ж знаю, что мне понадобится нужная поза нужной девки в нужном окружении.
Использую Hydrus-network как локальную буру
Baza.
Нахер вы шебм удалили? Я хотел свои файлы по такому же типу отсортировать, но видосик не скачал, т.к. принципиально не храню прон.
Какой-то обиженка пожаловался. Видосик есть в одном из тредов про заметки.
> Да и как вручную тегировать файлы с бур, если их миллионы
а не надо вручную, пишешь в конфиг
"rule34":
{
"filename": "{score}{tags[:200]}_{id}.{extension}",
"parent-directory": true,
"directory": ["rule34","{search_tags}"]
},
и все твои файлы с бур уже протегированы.
И в чем эти теги хранятся? Могу ли я перенести их на другой пк без потерь?
>1) Прогоняешь все фотки через CLIP, складываешь вектора в FAISS/Milvus
>2) Прогоняешь все документы через ELMO/BERT/T5, складываешь туда же
И это все локально работает? Или подписка на нейро-дата-центр это уже как счет за ЖКХ, само собой подразумевается?
Оффтоп, но уж больно меня вопрос апп-имеджей беспокоит.
Если ты спрашиваешь, то наверное не слышал про AppimageLauncher? И не надо, это ебаный рак.
Вообще в линуксах есть несколько мест для этого (https://ru.wikipedia.org/wiki/FHS):
- /opt - сторонние программы, на системном уровне
- /usr/local/bin - для бинарников/ссылок на бинарники, этот путь находится в PATH и потому программа становится доступной как команда.
- /usr/share/applications - для desktop-файлов (для интеграции, аля иконки на десктопе/лаунчере)
Если программа нужна только на уровне пользователя, то делают "локально":
- Саму программу кладут куда угодно, но для аппимеджей многие поступают по аналогии с макосью - создают папку ~/Applications.
(Альтернативный вариант положить в ~/.local/bin/)
- ~/.local/bin/ - для бинарников/ссылок.
- ~/.local/share/applications/ - для desktop-файлов.
Вроде бы все просто и легко. Но есть один нюанс - хочется иметь desktop-файл изкаропки, а не ебаться с его написанием. Для этого появилось несколько приблуд (в частности AppimageLauncher), который раскладывает файлы в указанные выше папки (в аппликейшнс и в декстоп-файл). Но эта мразь на самом деле делает гораздо больше ненужной хуйни: устанавливается как демон, регистрирует какой-то сабскрайбер на уровне ядра, перехватывает все обращения к appimage, и в добавок ко вссему вызывает их не прозрачно, а через какую-то обертку, которая ломает некоторые appimage (например https://github.com/flameshot-org/flameshot/issues/2764). И "выключить" его точечно ни как нельзя.
И вот итог такой, что либо ебешься и руками пишешь ебаные десктоп-файлы, либо заносишь себе в систему это говно, либо как дебил запускаешь нонейм-файлы без иконок из файлового менеджера.
Эмм... (как сформулировать-то) А как CLIP отвечает на натуральный язык?
Нет, даже не так. Где хранится его вокабуляр, как можно посмотреть, что он вообще в состоянии распознать, какие сущности он понимает?
У CLIP две задачи: свести фразу на натуральном языке в вектор, и свести картинку в вектор. При том так, чтобы расстояние между вектором фразы "котик лижет яицы" и вектором картинки с таким котиком было минимальным. Благодаря этому инструменту можно решать следующие задачи:
- найти среди овер 9000 картинок те которые ближе всего к описанию "кудрявая женщина с ярким макияжем сидит на мужском лице"
- найти среди овер 9000 картинок те которые ближе всего по смыслу и стилистике к выбраной тебе картинке
- определить какое из множества описаний типа "аниме", "большие сиськи", "80е", "купальник", "член торчит из-под юбки" подходит под эту конкретную картинку и автоматически назначить ей тэги.
Как это в целом работает можно потыкать например тут https://same.energy/
Вокабуляр, а точнее токенизатор, хранится в текстовом энкодере клипа. Статей про это в интернете примерно тысяча.
Но
>Вокабуляр, а точнее токенизатор, хранится в текстовом энкодере клипа
То есть вокабуляра как такового не существует, только токенизатор? Это вот этот https://github.com/mlfoundations/open_clip/blob/main/src/open_clip/bpe_simple_vocab_16e6.txt.gz
А это именно то что он "различает" на изображении или это просто общий словарь?
>Как это в целом работает можно потыкать например тут https://same.energy/
Судя по пикрилу детали не особо он различает (а может я просто дом труба шатал).
>Статей про это в интернете примерно тысяча.
Для меня порог входа высокий. Меня хватает только на поп-статьи Комаровского.
>можно решать следующие задачи
А еще вопрос, а можно решать задачу определения, что на двух фото одно и то же место, но с немного разного ракурса? Или это только "понятийный" поиск?
Хочу поделиться с аноном охуенной темой, которую использовал для сортировки свалки из аниме-пикч.
Представляю DeepDanbooru: https://github.com/KichangKim/DeepDanbooru (сурс)
Использует маш.об. для пометки изображений с помощью booru тегов.
Принцип работы - на вход нейронки подается развернутый (2d->1d) массив из пикселей изображения, модель съедает их и выдает результат ввиде 8000 значений, каждое из которых - вероятность того или иного тега.
Тулза упрощает работу с моделью нейронки и генерирует текстовый файлик с таким же именем как и у файла с изображением.
> как установить?
читай README репозитория.
> где скачать готовые модели?
В релизах репозитория: https://github.com/KichangKim/DeepDanbooru/releases
> где попробовать?
Веб-демо: http://dev.kanotype.net:8003/deepdanbooru/
> выдает хуйню
Модели, залитые в releases репозитория, обучены на датасетах из Danbooru. Хоть там и огромное количество изображений, все они анимешного и мультяшного характера, нужно это иметь в виду. Также, известен баг с изображениями, на которых есть повторяющиеся узоры (это проблема самой архитектуры нейронной сети)
Молодой, шутливый. 1к картинок и 1,2к швебок, это при учете того что я 2 раза терял весь свой пак с тем же количеством, пока не научился делать бекапы
И так, древо каталогов у меня примерно следующее:
2018
IMG
1
2
...
1100
VID моё
VID (не моё)
SCR
TXT (штук 300 *txt и вордов с заметками и мусором
PRG (тут проги всякие, но процентов 85 из них пора нах снести, потом что уже не актуальны)
BOOK (тут PDF и даже .DOC книжки всякие которые толком хуй прочитал даже все. Всего штук 120. Всякие самоучители и пр..)
REC (вот эта папочка действительно интересна с исторической точки зрения . Тут хранятся rec записи большей части моей жизни. Можно отслеживать даже как менялся мой голос с 16 лет до 35. Есть как и свежие записи моих голосовых как аудио дневник, так и совсем пиздюческие гле я в шараге на занятиях сижу) Я люблю всё записывать.
И ещё штук 10 каких-то директив дальше. Не помню названий, но глубже 2х-3х папок страраюсь никогда не закапывать файлы.
Дальше самое интересное к чему веду. Я акцентирую внимание на названии файла. Самая основная инфа о файле (которую я НЕ доверяю стандартным тегам будь то EXIF данные фоток или ID3 теги в звуках), я вношу в само название:
(230712-220500).jpg (.mp3/ .txt/....)
Означает что файл создан 23 июля 2012 в 22:05 я мог бы обойтись и без секунд разумеется но решил указывать 00 просто потому, что уже наладил программы для batch обработки моей помойки на анализ строк именно этой маски.
В принципе, с исторической точки зрения , Дата файла - это самое основное для меня поскольку в основном у меня фото и записи. Но названия файлов можно по желанию вносить ДО или ПОСЛЕ даты. Можно как угодно. Я сделал гибкий синтаксический анализатор, который не воспримет за ошибку даже отсутствие неизвестных компонентов времени . Типо (2307XX-220500).jpg .это означает, что известно что файл 23 июля, но какой конкретно ГОД под вопросом. Для этого просто надо написать два латинских икса XX. И того можно называть файл Я и моя собака (030522-134459).JPEG
Но я придумал ещё один префикс. Это что-то вроде [A5F6]. И того можно встретить файл на подобии Последний звонок (280506-123247)[S8Z4].bmp
Опять-таки, префиксы (..) и [...] не являются обязательными, и тем более их я не прописываю руками. Совсем нет. Это всё делает одна моя програмка, когда я типо решаю раз в полгодика "проиндексировать" свою помойку.
Конечно же анончик, если ты дочитал до этого момента, тебе наверняка показалось что по ту сторону сидит какой-то шизик. Но я поясню дальше. Я придумал эту всю систему для того , чтобы сделать полноценный электронный дневник дневник. Это даже не столько дневник, как возможность вести хронологические записи вообще ВСЕГО и ВСЯ . Всей жизни буквально.
Для этого я завел Excel . На 75000 строк (365 х 200лет диапазон взял). Я понимаю, что я никак не доживу до 90 или до 100 лет. Поэтому ограничился конечной датой - 2070 г. Excel я "поженил" со своим ПО (именно я это ПО писал для обработки файлов) и теперь Excel анализирует файлы именно на предмет наличия этих самых скобок (с датой) . Далее он разделет строку на дату и время и индексирует в ячейку нужную. Я по-сути дела создал себе довольно интересный дневник. Пикчи прикрепляю обязательно.
Но у меня возник один затор. в ID в именах файлов [..] не могу реализовать счётчик типа
1A1A1
........
9X9X
На random перелистывание. Там всего 12 миллионов комбинаций получиться должно на выходе. По идее. Этого числа файлов не событий мне должно хватить на всю жизнь. С учётом того, что за 16 лет коллекционирования набралось только 150К файлов. Хоть убей, но после образного D4V8N6 идёт D4V8N7
В этом нет ничего страшного технически, но когда просматриваешь список файлов с индексами. То мозолит глаза эта последовательность. Надо что бы код следующий не был похож на предыдущий. Типо после C4F2D9 ,шло какое-нибудь H7W5Z1 но при том, этот код (или же числом можно даже его представить int 1..12000000) должен быть лишь псевдослучайным. Т.е предсказуемым. Чтобы исполяемый код программы всего-навсего за один проход мог его рассчитывать. Не обращаясь лишний раз к громадным массивам
И так, древо каталогов у меня примерно следующее:
2018
IMG
1
2
...
1100
VID моё
VID (не моё)
SCR
TXT (штук 300 *txt и вордов с заметками и мусором
PRG (тут проги всякие, но процентов 85 из них пора нах снести, потом что уже не актуальны)
BOOK (тут PDF и даже .DOC книжки всякие которые толком хуй прочитал даже все. Всего штук 120. Всякие самоучители и пр..)
REC (вот эта папочка действительно интересна с исторической точки зрения . Тут хранятся rec записи большей части моей жизни. Можно отслеживать даже как менялся мой голос с 16 лет до 35. Есть как и свежие записи моих голосовых как аудио дневник, так и совсем пиздюческие гле я в шараге на занятиях сижу) Я люблю всё записывать.
И ещё штук 10 каких-то директив дальше. Не помню названий, но глубже 2х-3х папок страраюсь никогда не закапывать файлы.
Дальше самое интересное к чему веду. Я акцентирую внимание на названии файла. Самая основная инфа о файле (которую я НЕ доверяю стандартным тегам будь то EXIF данные фоток или ID3 теги в звуках), я вношу в само название:
(230712-220500).jpg (.mp3/ .txt/....)
Означает что файл создан 23 июля 2012 в 22:05 я мог бы обойтись и без секунд разумеется но решил указывать 00 просто потому, что уже наладил программы для batch обработки моей помойки на анализ строк именно этой маски.
В принципе, с исторической точки зрения , Дата файла - это самое основное для меня поскольку в основном у меня фото и записи. Но названия файлов можно по желанию вносить ДО или ПОСЛЕ даты. Можно как угодно. Я сделал гибкий синтаксический анализатор, который не воспримет за ошибку даже отсутствие неизвестных компонентов времени . Типо (2307XX-220500).jpg .это означает, что известно что файл 23 июля, но какой конкретно ГОД под вопросом. Для этого просто надо написать два латинских икса XX. И того можно называть файл Я и моя собака (030522-134459).JPEG
Но я придумал ещё один префикс. Это что-то вроде [A5F6]. И того можно встретить файл на подобии Последний звонок (280506-123247)[S8Z4].bmp
Опять-таки, префиксы (..) и [...] не являются обязательными, и тем более их я не прописываю руками. Совсем нет. Это всё делает одна моя програмка, когда я типо решаю раз в полгодика "проиндексировать" свою помойку.
Конечно же анончик, если ты дочитал до этого момента, тебе наверняка показалось что по ту сторону сидит какой-то шизик. Но я поясню дальше. Я придумал эту всю систему для того , чтобы сделать полноценный электронный дневник дневник. Это даже не столько дневник, как возможность вести хронологические записи вообще ВСЕГО и ВСЯ . Всей жизни буквально.
Для этого я завел Excel . На 75000 строк (365 х 200лет диапазон взял). Я понимаю, что я никак не доживу до 90 или до 100 лет. Поэтому ограничился конечной датой - 2070 г. Excel я "поженил" со своим ПО (именно я это ПО писал для обработки файлов) и теперь Excel анализирует файлы именно на предмет наличия этих самых скобок (с датой) . Далее он разделет строку на дату и время и индексирует в ячейку нужную. Я по-сути дела создал себе довольно интересный дневник. Пикчи прикрепляю обязательно.
Но у меня возник один затор. в ID в именах файлов [..] не могу реализовать счётчик типа
1A1A1
........
9X9X
На random перелистывание. Там всего 12 миллионов комбинаций получиться должно на выходе. По идее. Этого числа файлов не событий мне должно хватить на всю жизнь. С учётом того, что за 16 лет коллекционирования набралось только 150К файлов. Хоть убей, но после образного D4V8N6 идёт D4V8N7
В этом нет ничего страшного технически, но когда просматриваешь список файлов с индексами. То мозолит глаза эта последовательность. Надо что бы код следующий не был похож на предыдущий. Типо после C4F2D9 ,шло какое-нибудь H7W5Z1 но при том, этот код (или же числом можно даже его представить int 1..12000000) должен быть лишь псевдослучайным. Т.е предсказуемым. Чтобы исполяемый код программы всего-навсего за один проход мог его рассчитывать. Не обращаясь лишний раз к громадным массивам
Естественно не собираюсь ограничиваться пятью стандартными состояниями: на работе/ дрма,/ в Ютубе/ на прогулке/
а собираюсь ещё пару десятков добавить
Прога бесплатная. Всем рекомендую
Если скормить всю эту хронологию и архивы какой-нибудь LLM'ке, получится кибер-анончик библиотекарь по собственным записям, лол.
Охуеть конечно ты заморочился, вот это я понимаю quantified-self. Были ли промежутки когда заебывался вести эту систему? Какие "инсайды" или откровения смог получить, анализируя и просматривая старые данные?
С 2020 и 2021 была пауза. Тупо работа и не было свободного времени. Толком даже компьютер не включал, и не кодил ничего. Разве что музыку перед сном послушать. Но чисто периодически включал комп что-бы память в телефоне освободить. Делал бекапы. Сваливал в кучу накопившиеся Rec, фотки и видео короткие. Правда в кучу сваливал типо /Сброс 19112021.. и в этой папке беспорядочная куча файлов. Потом месяца через два опять другую папку создаю /Сброс14022022 и т.д.
Ну и раз в год потом сортировка
Респект, интересная система. Сам тоже думаю о создании централизованной базы знаний и архива. Только перед этим нужно выкопать тонну файлов, раскиданных по самым разным дискам, устройствам, клаудам, что вызывает фрустрацию. Плюс придумать саму систему и методологию её ведения, да так, чтобы работало с учетом индивидуальных особенностей и не стала слишком накладной.
> Но чисто переодически включал комп что-бы память в телефоне освободить.
В теории, можно перенести эту систему на домашний сервер, который будет выступать в роли NAS, пробросить впн между сервером и клиентами (телефоном, рабочим местом и т.д.) через какую-нибудь оверлейную сеть по типу zerotier, получится система которая будет всегда под рукой. Может быть даже веб-приложение сделать, которое будет кросс-платформенно внутри самой сети впн работать на любом браузере, чтобы удобно работать с системой.
Повезло. У меня страшно представить сколько шебмок и пикч за последние 10 лет накопилось. На одном только облаке ~10к картинок, а их несколько, и это не единственное место где они лежат. Потомкам показывать накопившихся ехидных колобков, лол.
> Сервер, чтобы данные всегда были под рукой на всех устройствах
Вот это действительно было бы круто. Думал об этом. Хотелось именно через облачное хранилище это реализовать. Но конечно же в копеечку будет обходиться. Мне как минимум гигов 500 надо резервировать. Потому что сейчас уже под 600 Гб данных. Но сожму со дня на день. Видосов дохрена. До 500 опущусь точно.
Я могу подсказать метод. Но он может тебе не подойти. Тут надо целой концепции следовать, и написать для себя небольшой софт для удобства.
Я на Паскале делал программулину, которая автоматически пробегала по каталогам указанным заранее, и анализировала теги в файлах на предмет Дата изменения/создания. В основном это интересовало. Ну а потом она автоматически втыкала дату в скобках () между исконным названием файла и расширением.
Track145.wav
Track145(140823-135347).wav
Но мне пох как-бы, мне для себя эти файлы, а не на показ или куда-нибудь в публичный доступ. Мне именно так удобнее.
А знаешь как на самом деле потом удобно искать? Я вчера буквально в облаке ковырялся у себя и одним запросом по поиску "(3112" в именах файлов отыскал с десяток фотографий, которые я делал к примеру в предновогодие 31 декабря за всю жизнь.
Преимущество тегов в именах файлов заключается в том, что к примеру есть у тебя фотографии штук 500 . И тебе их надо конвертнуть. После конвертации не факт что EXIF данные выживут. Это же касается и видосов и аудио. Дата создания/изменения в большинстве случаев сбрасывается на дату конвертации. А если дата заключена в имени файла, то ты застрахован от этой подъебки. Ты не просто застрахован, а тебе вообще похуй на эти теги. Ты к ним не привязан. Главное лишь привыкнуть к скобкам с цифрами в названии. Но они прижаты к правому краю имени файла к *.jpg и расширению, поэтому ты по прежнему можешь их даже упорядочить по алфавиту или наоборот.
А можешь и вовсе сперва даты файлов парсить в названиях, а потом уже имя и расширение. Тогда уж точно они отсортируются согласно алфавитного порядка. У меня получается что-то типо этого:
(010923-225244) Track052.mp3
(010923-231536) DSCN_00025.jpg
(040923-115219) DSCN_00463.jpg
...
Но мне лично так и надо. Я делаю упор на хронологию в основном. Я создаю огромный хронологический дневник своей жизни
255 символов это ни о чем. Теги на бурах это до 700.
А автор и имя персонажей не то, что информитивны при тысячах пикч, увы. Включение длинных имен почему-то именно у меня ну никак не помогло. Наверное, потому что это относится к пути, а не имени файла.
> Какого хуя это ещё не решено на уровне файловой системы?
> хардлинками?
Ты дебич? Или какого ты решения хочешь?
Решено в любой современной файловой системе с дедупликацией. То есть в эпловской APFS, майковской ReFS, педоликовских ZFS и btrfs.
А нужно ли это вообще? Если в материальном мире нельзя, то может и в виртуальном тоже не надо?
https://www.youtube.com/watch?v=Srh7ODRdJIc
Ну во первых файл равноправны. Можешь удалить любой из двух и второй гарантированно останется. Во вторых дедуплицировать можно часть файла. Если ты скопируешь гигабайтный дамп и изменишь в нём 20 кб данных, то суммарное занятое место будет 1Гб+20Кб, а не 2Гб
> Ну во первых файл равноправны. Можешь удалить любой из двух и второй гарантированно останется.
А хардлинки?
> Во вторых дедуплицировать можно часть файла
1. Где это надо?
2. Что это может?
У меня на работе васяпомойка на серваке какая та, все работают с сетевым диском, папок насоздавали что сами ничо найти не могут.
Всё что я сделал это раскидал всех по папка=кабинет, но внутри это главных папок сущий ад.
Короче, как в нормальных корпорациях это всё разруливают???
Я не тот анон, но с линками/ярлыками проблема чисто бытового плана - их нельзя нормально создавать (в линуксе по крайней мере) - нет интерфейса. То есть нельзя легко и удобно выбрать создать софт- или хард-линк, создать абсолютный или относительный.
Потому, видимо, ими на практике толком не пользуются, хотя механизм очень мощный.
Да также все - все группы срут в шаринг папки. У низовых одна шаринг папка с кучей директорий пр ранжиру: смены, коллективы, графики, контрагенты без пд, телефоны, сотрудники, выборки данных в экспорт, результаты. Удобно, несмотря на срач.
Где я был - да. Все кто в шаринг папке - они даже пути не помнят, им отдельный сетевой диск делай, который будет ссылаться на их папку в шаринг папке. Пусть думают, что у них отдельный диск.
Они реально туда складируют все по рандому. И бэкапы иногда выгодно делать с аргументами по времени создания и изменений, если инкрементные архивы нельзя делать у тебя. Это же нормисы, насрать на пол и смотреть годами на это - для них это норма. Как и порево в шарингах и почте.
Сначала спроси себя, почему это стало твоей головной болью. Ты занимаешься техническими средствами, можешь настроить доступ, текстовый поиск, инструменты для взаимодействия, решаешь возникающие проблемы. Если кто-то полчаса ищет файл в помойке, то это проблема сотрудника или организации совместной работы нескольких сотрудников. Если это устраивает ответственных людей, то в чём проблема?
Пердоля, то есть это не ваше айти лохи, это "нормисы" виноваты что они "нормисы"?
> Проблема не является технической…
> Возможно ли её решить этим техническим средством?
Понятно, чукча не читатель.
Но это тебя долбоеба трясет.
Я просто пытаюсь понять как мы до такого дошли что не можем организовать работу
>не можем организовать работу
Работа не организована по умолчанию. Нужно прикладывать усилия, чтобы в ней появилась организация. Для этого существуют специальные специалисты: менеджеры и управленцы.
Тот или иной софт может быть инструментом в руках этих специалистов, но заменить их он пока не может.
Кто «мы»? У тебя есть полномочия сказать «Так, с сегодняшнего дня все имена файлов начинаются с даты документа и заканчиваются контрольной суммой»? Если нет, то у нет у тебя рычагов, и это просто благие намерения. Когда директор напишет бумажку, в которой такое будет сказано, и там будет пункт «эникейщику Пупкину обеспечить автоматическое удаление не соответствующих стандарту файлов из каталогов общего пользования, восстановление нужного — только по записке на моё имя», тогда и начнётся какая-то организация.
Нет конечно, у них веб залупа какая-то. И в софте офисе работники не работают. Алсо что тебе мешает спросить в нормальном месте?
Запоздало скажу тебе спасибо!
Нормальный ответ был дан больше одного раза, но не услышан. Если у нашего рационализатора нет возможности заставлять других сотрудников что-то делать, то они этого делать просто не будут, даже если всех умолять или предлагать сто рублей из своего кармана каждому, кто рассортирует файлы.
То, что обсуждение пустое, можно понять хотя бы по тому, что человек сам не знает, что будет делать. Есть смутное «мне не нравится, как файлы разложены», а чёткое задание даже не сформулировано. Следовательно, не было стадии сбора информации о процессах, которые предполагается «оптимизировать», и все они станут сюрпризом. Например, в зависимости от того, кто в какую смену работает, первый приходящий в отдел поливает цветы и на компьютере, в котором открыта таблица с ценами и курсами (чтобы никто случайно не испортил по сети), один раз обновляет циферки на день. Это может быть нигде не описано, но на этом могут держаться все остальные процессы. Если ты, будучи не в курсе, что-то не то сделаешь с файликом или как-то вмешаешься, вызвав расхождение в данных, то за разницу в деньгах отвечать тоже тебе, а не «тупым тёткам, которые не могут правильно всё настроить». Или, например, дизайнер А все свои готовые материалы держит на компьютере в идеальном порядке, а к сетевым дискам относится как к помойке, куда просто кидает копии по запросу и не интересуется, что с ними дальше будет. Дизайнер Б, напротив, считает, что там СЕРВЕР и БЭКАПЫ, и что проект, который несколько человек собрали в папочку к дате презентации, будет там лежать годами до конца света, и всегда можно будет к нему обратиться. И так далее, и так далее.
Профессиональные системы могут связывать разные сервисы со ссылками на файлы вроде чатиков и багтрекеров в единую систему, отслеживать использование общих файлов по пользователям и группам, чтобы при выборе предлагать активные, автоматизировать повторяющиеся действия с документами (вроде писулек «да»/«нет», «принять»/«отказать»), но они не могут придумать содержание за тебя и не могут решить за тебя, какую иерархию данных выстроить.
Нормальный ответ был дан больше одного раза, но не услышан. Если у нашего рационализатора нет возможности заставлять других сотрудников что-то делать, то они этого делать просто не будут, даже если всех умолять или предлагать сто рублей из своего кармана каждому, кто рассортирует файлы.
То, что обсуждение пустое, можно понять хотя бы по тому, что человек сам не знает, что будет делать. Есть смутное «мне не нравится, как файлы разложены», а чёткое задание даже не сформулировано. Следовательно, не было стадии сбора информации о процессах, которые предполагается «оптимизировать», и все они станут сюрпризом. Например, в зависимости от того, кто в какую смену работает, первый приходящий в отдел поливает цветы и на компьютере, в котором открыта таблица с ценами и курсами (чтобы никто случайно не испортил по сети), один раз обновляет циферки на день. Это может быть нигде не описано, но на этом могут держаться все остальные процессы. Если ты, будучи не в курсе, что-то не то сделаешь с файликом или как-то вмешаешься, вызвав расхождение в данных, то за разницу в деньгах отвечать тоже тебе, а не «тупым тёткам, которые не могут правильно всё настроить». Или, например, дизайнер А все свои готовые материалы держит на компьютере в идеальном порядке, а к сетевым дискам относится как к помойке, куда просто кидает копии по запросу и не интересуется, что с ними дальше будет. Дизайнер Б, напротив, считает, что там СЕРВЕР и БЭКАПЫ, и что проект, который несколько человек собрали в папочку к дате презентации, будет там лежать годами до конца света, и всегда можно будет к нему обратиться. И так далее, и так далее.
Профессиональные системы могут связывать разные сервисы со ссылками на файлы вроде чатиков и багтрекеров в единую систему, отслеживать использование общих файлов по пользователям и группам, чтобы при выборе предлагать активные, автоматизировать повторяющиеся действия с документами (вроде писулек «да»/«нет», «принять»/«отказать»), но они не могут придумать содержание за тебя и не могут решить за тебя, какую иерархию данных выстроить.
Раз уж по делу
подскажите аноны нейронку которой можно рассортировать фурри порнуху от аниме и прочего лолишотакона с ирл лолями,
пробовал куча хуевин, они все только лолей сортируют, да и тех иногда пихают в манямэ, а фуррей так ваще вместе складируют,
может есть какой-то более дельный инструмент
с меня как обычно нихуя!
Попробуй DeepDanbooru, с выхлопом ввиде буру-тегов легко работать и сортировать как твоей душе угодно своими скриптами
Одобряю этот пост, благодарность!
Какая же она блядища. Так и представляю как её натягивает на кукан алжирский негр.
p.s. В США преподы в универе обнаружили, что многие новые студенты не понимают концепции иерархии "папок" в компе. Для них файлы - это как раз такая вот куча.
Инклюзивное и расово разнообразное образование, итоги.
Русня никогда не видела ничего кроме папочек как в 80х?
Для либ, к примеру. Можно иметь тридцать три разные версии, все файлы разные под конкретную прогу, но места занимают не в тридцать три раза больше, а в полтора или меньше.
Правда хуевато работает для бинарников. Сам не пробовал.
Винить надо не хуюмеров, а пидорасов из гулага и прочих дерьмоделов мобильного шлака, они в гандондроиде все запрятали в галереи блять, в а гандондроиде например до сих пор нету стокового файлового менеджера, если вендор его не предустановил, во времена шимбиана и винды мобайл это казалось дикостью, как можно не пользоваться файломенеджерами, но увы анон, во времена говноойс и говнодроида это теперь норма, а сами файловые менеджеры тормозное говно, не в малой степени к этому приложил и хуюгл высрав в 13 версии пидорасдроида новый эй пи ай
замедляющий чтения и доступ к файлам, в папке с 10к фотками тупо секунд 15-20 требуется чтобы только сами иконки прорисовались, еще 10 на тумбнейлы, а обычные шмертные ололокают. этож новые нискусчные кнопочки и обои
Раньше смартфоны были гиковской темой, сейчас же смартфоны это пэка для совсем имбецилов не осиливших шиндус,
вот и имеем в итоге идиотов, которые в последний раз компами пользовались в 2010м на допотопном 2 ядерном ноуте,
а иногда и дебилов которые эти ваши компы в жизни не видали,
для меня до сих пор это остается дикостью, как можно блять иметь малопиздрическое говно с экраном, которые нужно только чтобы подрочить лежа в кровати и ответить 2 с 5 коллегам с работки,
попутно проскроллив нулевую, и пользоваться им на постоянке абсолютно для всего, вот так анон, а еще из забавного, некоторые особо умные 300iq дебилы купили свой первый комп во время залупавируса, только чтобы сидеть в зуме, до этого они пользовались компом только на работе, некоторые пошли еще дальше, и заявляют, что зачем им комп дома, он в основном нужен для работы как и принтер!!!!!
вот просто имаджинируйте ебало, у человека дома нету даже самого всратого ноута за 5-10к с вторички...
ps сам лично встречал микрочелика у которого и бабки есть на хуйоми за 20к, а компа всю жизнь не было и он только в 25 лет первый комп собрал, до этого у друзей играл и у мамки на работе,
а я блять еще насчет принтеров бугуртил, у меня хуепсон л355 уже лет 12 наверное, тот самый с снпч. я столько бабок сэкономил на копиях документов, его раза 2-3 точно окупил!
Сколько денег ты сэкономишь таким образом?
Заметил, что бэкап-винчестер не слишком быстро ворочается под тысячами мелких файликов. При открытии папки, как будто поштучно ищет иногда, аж задыхается.
Есть идеи, как улучшить ситуацию со скоростью доступа?
32ГБ памяти, если это важно.
а) Любая приличная программа просмотра картинок умеет работать прямо с архивами. Придумано было ещё в стародавние времена, чтобы не хранить сотни страниц комиксов отдельными картинками. Пользуйся нормальными инструментами.
б) Нормальные файловые системы не теряют в производительности при росте числа файлов на порядки. NTFS в этом отношении изначально неплоха, а начиная с Vista или 7 в драйвере отключили обязательно обновление времени обращения к файлам, так что система ограничивать не должна. Другое дело, что «открываешь папку» ты чем? Правильно, конкретной программой, называемой «Проводник». А что он хочет делать с базой эскизов для всех этих файлов, какие в нём стоят системные или внешние плагины, которые пытаются переварить такое число файлов или найти среди них определённые типы, чтобы иконочки или пункты меню добавить? Надо разбираться и настраивать.
>>434312
У меня в стандартной Nokia на Symbian простенький менеджер файлов был запихан в дальнюю папку с утилитами, и не показывал никаких скрытых или системных каталогов, так что доступа к системе обычный пользователь точно так же не имел.
> а) Любая приличная программа просмотра картинок умеет работать прямо с архивами.
Это какая?
> б)
+
Любая.
Дед, 20 лет такой функции в программах, не два года. Вылезай уже из под камня, откладывай беспомощный встроенный просмотр картинок в сторону, нормальное что-нибудь пробуй.
В гандондроиде кстати файловую систему настолько распидорасили после 11 версии, что 10к картинок в папочке на ufs 3.1 встроенной памяти по 10 секунд занимает и это только подгрузка объектов,
тамбнейлы еще секунд 5-6 грузятся,
самый пиздец еще в том, что если попытаться ту же самую папку стянут по smb - она открывается моментально,
криворукие хуесосы из гугла со своим api убили нахуй работу с файлами в последних версиях гондони, а нормисы жрут и причмокивают хули, все в галеи и музэчки! а остальное в хуюгл дизге
Извини, не имею пользоваться интернетом. Будем с тобой на одной скамейке для даунов сидеть.
Не, ты там один будешь сидеть.
Моментально, список файлов расшаренных через сеть по smb,
если проще, файлы которые расшарил на компе и подключил к оному через ftp/smb. вот к ним доступ моментальный,
А доступ к локальный файлам на самом смартфоне
медленнее чем по сети!
В чем проблема получить список файлов без превьюшек и прочего? Или у тебя по сети и превьюшки грузятся?
CX проводник подтягивает и то и то,
не важно включены тамбнейлы или выключены,
результат один и тот же, в гандондроиде после 11 версии на хую вертели производительность FS, ввели новый уебищный api для доступа к файлам под видом йоба конфиденциальности, только не подумали, а может хуй клали на тормоза файловой системы, из-за чего и получается такая комичная ситуация, когда с nas'а или компа с расшаренными файлами через cx проводник или любой другой файломенеджер на гандондроиде
файлы быстрее подгружаются чем со встроенного хранилища
на втором мобиле где 10 гандондроид
такой проблемы нету и файлы подгружаются моментально, что с встроенной памяти, что с nas'а,
Для себя решил, проще хранить коллекцию нарисованных некололей и фурриебского непотребства на nas'е, чем ждать по 15 секунд пока это гугловское уебище в виде api прогонит через себя файлы и изволит файломенеджеру отрисовать сначала список файлов, а потом тамбнейлы
> CX проводник подтягивает и то и то,
Ебать охуенная прога! И работает шустро. До этого юзал тотал коммандер (деревянный, но без отрицательных фич) и засратый рекламой es проводник.
Какими прогами можно открывать видео файлы в локальном плеере без скачивания?
Наверняка специально замедлили, принудить быстрее перейти на анальную затычку без доступа. А тем временем, эппл у которого такой анал и был всегда, наоборот дает доступ к файловой системе, ибо даже эпплобыдло заебало что приложения ничего не могут.
>Мне так и не объяснили нахуя он нужен, если винда уже научилась в индексацию
Там можно указывать что индексировать а что нет, удобно сортировать и фильтровать по типам файлов, еще можно забиндить появление окна на Ctrl+Q (ну или че угодно)
Еще я например кстати через rclone сделал виртуальный диск из яндекс диска облака и по нему тоже за 1 сек ищу файлы и открываю. 2 ТБ яндекс диск, можно стримить кино не скачивая
Сейм, пидорам из купертино в браузере позволяют ставить экстеншены, а андроидоблядям ссут на ебло клонами 47 хромоногой параши, что брайв хуяв что говнохромиум от хуюгла, говно без задач, единственный более менее нормальный браузер на хромиуме на гандондроиде это киви браузер, но и он сука тормознее некуда блять, на 860 снэпе работает заметно медленнее хромоногого, еще и в 60гц, но ради адблока, обхода ебучей роскомпараши и даркридера
приходится терпеть его выебоны, фурряфокс мне вообще не зашел, что на десктопе что на ведройде, уебищный рваный скролл и отсутствие переводчика страниц, я перепробовал кучу расширений, но не смог найти то, который бы не открывало в новой вкладке. а переводила уже имеющиеся страницу нажатие блядской кнопки, как это в хромиум подобной поеботе реализована,
на гандондроиде еще и урезали количество расширений которые можно установить, но лечится установкой форков вроде айсрейвена,
в отличии от хромопоеботы даже с мозилловским акком синхронизируется, в остальном это блять позор, в 2к24 на телефончиках нету нормального сука браузера с экстеншенами,
зато все орут про коконфединциальность как дегенераты из брейва,
можно конечно и говна в виде хуяндекса навернуть, но я еще не настолько отбитый чтобы делится данными еще и с товарищем майором
Научилась выдавать 2-3 файла в поиске через спуск, поиск в проводнике все еще тормозной отсос даже на ссд,
еверитхинг и свифтсерч64 ищут практически моментально в обход ублюдошной ntfs
Вот есть много документов. Все вместе занимает дохуя места. И следовательно усложняется бекап.
Однако, львиная доля это медиа-файлы. А они в 99% случаев не являются критикал. Ну например: я храню медицинские записи - там есть увесистные КТ, снимки. Они важны, но не критикал, гораздо важнее сопутствующие выписки. То есть в критикал-бекап я бы их не включал. Включал бы во 2-ю или даже 3-ю очередь резервирования. Но сохранять и пользоваться ими хочется в одном вместе.
Можно было бы такие некритикал-файл хранить отдельно и линковать ярлыками/софт-линками. Но проблема в том, что это нихуя не кроссплатформенно (мак/шин/линь, нтфс, экст, фат32, облако).
Идея - сделать свой наколеночный гит лфс.
Например: файлы помечать в названии определенными маркерами. Запускать пердолинг-скрипт. Если есть такой-то маркер, то файл заменять на ссылку/ярлык, а сам файл перемещать в специальный каталог. Push to backup заменяет ссылки/ярлыки текстовыми файлами-указателям. Pull from backup заменяет файлы-указатели на ссылки/ярлыки.
Пиздец велосипед. Но как еще достичь и удобства использования и хорошего резервирования?
Но смысл не в игнорировании - резервироваться должно все, но разными способами и с разным приоритетом. А храниться на стороне пользователя должно все вместе.
Но я уже увидел, что рклон умеет бекапить софт-линки (именно тем способом, который я собирался пердолить - текстовыми файлами-указателями). Это решает часть задачи, хотя и вендор-лочит на рклон.
При этом создавать софт-линки пожалуй все равно легче скриптом по признаку в назывании файла, чем руками, ибо нет нормального UI для этой функции.
>Делаешь два игнорлиста
В том и вся соль, чтобы ничего не делать. А так на каждый чих нужно задумываться в какой черный/белый список файл засунуть.
Хотя... зависит от механизма. Если можно гибко описывать правила (читай распарсить маркеры из имен файлов и/или учесть размер), то тогда это, пожалуй, решение.
Надо подумать. Просто я в голове уже напредставлял, что второ- и третье-степенные файлы будут пролинкованы по отдельным папкам. И тогда а) наглядно видно что-куда б) сразу есть понимание размеров.
У меня столько только за 3 месяца
Носочкин, ти?
полегче псинка
Гугл пикаса из 2007 года такое умела вроде, да и другой софт вроде был
зачем для этого нейросеть?.
В NTFS такое работает?
любой классификатор на clip
Ты не говорил, что ненавидишь Obsidian. Ты просто указал на недостатки его использования в конкретном случае. Однако упорно настаиваешь на своем любимом инструменте, не рассматривая альтернативы.
У тебя на нтфс до пизды полей метаданных и вдобавок альтернативные потоки, куда можно хоть небо с аллахом запихнуть.
Очистить корзину же.
это лучшая форма из mad
Проблема в том, что сервер возвращает превьюшки вместе со списком файлов. Если файлы находятся в сети, то превьюшки могут загружаться, что замедляет получение списка файлов.
Хостинг с картинками для педофилов. Я не шучу, на любой буре подавляющая часть контента сексуализирует детей.
Это уже твое мнение. Инструмент отвечает запросу ОПа и тематике топика.
>Собсна вот суть этой хуетыhttps://androidinsider
Можно ли рассмотреть такой вариант
>ru/smartfony/novaya-funkcziya-android-11-stala-golovnoj-bolyu-dlya-razrabotchikov
На что там как практически все крашится нахуй
Разобрался. Там все нормально.